声音隔离技术增强与识别语言准确度.doc
《声音隔离技术增强与识别语言准确度.doc》由会员分享,可在线阅读,更多相关《声音隔离技术增强与识别语言准确度.doc(4页珍藏版)》请在三一文库上搜索。
1、声音隔离技术增强与识别语言准确度在嘈杂的环境中,对于手机、可穿戴设备和其它智能设备来说声音隔离技术能够提升语音增强和识别准确度声音或语音用户接口在手机、平板电脑、可穿戴设备和其它智能设备上变得越来越普遍和重要,因为这项技术确实让这些设备不需要再设计键盘或者触摸屏。为了能够提供更精确的语音处理过程,系统在设计时必须要保证对语音正确可靠的识别,即使在复杂的噪声环境条件中。目前已经有数百万人已经依赖自动语音识别技术来将语音转换为文字来编写文档和生成文本。然而自动语音识别的质量主要依赖于一些最优条件,比如假设每个人说话的方式与声音训练数据非常类似,讲话处在安静的环境中避免噪声干扰,即使这样也需要工作人
2、员来修改文字错误、标点以及语法错误,此外还可能存在其他类型的翻译错误。语音技术的持续改进对于提升设备对人类语言的识别准确度非常有必要,在手机、智能设备应用以及诸如汽车这样的噪声环境下语音识别技术的效果对其能否成功至关重要。图1:噪声环境下声音隔离技术提升设备的语音增强和识别效果语音增强是基于声音隔离和噪声抑制技术,本篇文章主要介绍声音隔离技术,实现噪声剔除和语音增强,因此下面只对噪声抑制做了简要介绍。噪声抑制技术能够帮助去除不同类型的背景噪声,防止干扰语音识别。噪声的显著特征主要体现在时间域和频域,时间域的噪声包括连续、断续和脉冲型的噪声,频域噪声包括宽频带和窄频带噪声。办公室和交通的声音、操
3、作设备的声音和嘶嘶声是典型的连续型噪声,这类噪声变化非常慢。非连续型噪声是重复的噪声,比如喇叭或者铃铛的声音。脉冲式的噪声通常比较生硬如点击和重击的声音。宽频噪声如嘶嘶声可能有不同的频率,窄频噪声的发生往往在一定的频率范围内,包括正弦波、嗡嗡声和机器噪声。工程师们已经尝试了各种滤波技术,每种技术会对不同类型的噪声都有一定的积极作用。然而每种噪声的特性会随着时间有些改变,工程师可能也需要采用自适应算法来动态匹配噪声的变化,一些噪声剔除技术的例子包括频率补偿、脉冲过滤、自适应宽频滤波、自适应逆向滤波和立体滤波等。认识声音隔离技术声音隔离是提升语音识别度的一种新型方法,传统的方式是屏蔽和过滤不同的噪
4、声,声音隔离技术则侧重于鉴别人语音的某种具体特征来判定和传输有效的语音,从而过滤掉背景噪声。声音隔离技术能够显著提升语音的清晰度和识别度,即使在噪声环境中。为了能够可靠的鉴别人语音的部分,声音隔离系统需要采用声学和语言模型,这里向大家介绍了两种目前嵌入式设计中采用的建模方法。第一种是深度神经网络算法,第二种是耳蜗仿真,即模拟人听力系统从内耳到大脑的行为。采用深度神经网络的方法需要一个大型数据库,包含数百小时以上的噪声和语音,用于训练算法系统。起初在这个数据库对语音没有概念,通过大量的训练开始学习鉴别人类不同的语音模式,声音隔离的质量包括能够判定不同声音的来源,通过两个或者更多的麦克风来采集音频
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 声音 隔离 技术 增强 识别 语言 准确度
链接地址:https://www.31doc.com/p-3418589.html