MATLAB应用专题实践课程设计-基于MATLAB的语音信号的时、频域分析.doc
《MATLAB应用专题实践课程设计-基于MATLAB的语音信号的时、频域分析.doc》由会员分享,可在线阅读,更多相关《MATLAB应用专题实践课程设计-基于MATLAB的语音信号的时、频域分析.doc(18页珍藏版)》请在三一文库上搜索。
1、郑州轻工业学院MATLAB应用专题实践课程设计说明书基于MATLAB的语音信号的时、频域分析摘要:MATLAB 语言是一种数据分析和处理功能十分强大的计算机应用软件 ,它可以将声音文件变换为离散的数据文件 , 然后利用其强大的矩阵运算能力处理数据 ,如数字滤波 、傅里叶变换 、时域和频域分析 、声音回放等。本课程设计通过PC机分别在安静环境和噪杂环境录制自己的语音文件,运用MATLAB提供的函数进行仿真分析,画出采样后语音信号的时域波形和频谱图,分析相应的图形参数含义。并设计合适的数字滤波器,对含有噪声的语音信号进行滤波,进行时域、频域分析,比较滤波前后的时域、频域变化,且进行相应的参数分析!
2、 关键词:MATLAB;语音信号;时频域;滤波 目 录1. 语音信号的采集12. 语音信号的时、频域分析22.1 语音信号的时域分析22.1.1 语音信号的时域波形22.1.2 短时平均能量分析32.2 语音信号的频域分析63. 数字滤波器的设计73.1 滤波器的设计选择73.2 IIR数字滤波器的设计83.3 对含噪语音信号进行滤波104. 心得体会10参考文献11附 录121. 语音信号的采集为了将原始模拟语音信号变为数字信号,必须经过采样和量化两个步骤,从而得到时间和幅度上均为离散的数字语音信号。取样是将时间上连续的语音信号离散化为一个样本序列。根据取样定理,当取样频率大于信号的两倍带宽
3、时,取样过程不会丢失信息,且从取样信号中可以精确地重构原始信号波形。经过预滤波和采样后,由A/D变换器变换为二进制数字码。这种防混叠滤波通常与模数转换器做在一个集成块内,因此目前来说,语音信号的数字化的质量还是有保证的。市面上购买到的普通声卡在这方面做的都很好,语音声波通过话筒输入到声卡后直接获得的是经过防混叠滤波、A/D变换、量化处理的离散的数字语音信号。实际工作中,我们可以通过很多种方式录制语音信号,如手机、电脑、MP3、录音笔等,然后通过转换工具将音频格式转换为MATLAB可以识别的音频文件格式,这里的转换工具可以是千千静听或者其它的专用音频文件格式转换软件,可以获得任何我们想要的音频格
4、式。本设计中我们利用windows自带的录音机录制语音文件,图1-1是基于PC机的语音信号录制过程,声卡可以完成语音波形的A/D转换,获得WAV文件,为后续的处理储备原材料。wavA/D采样滤波麦克风声卡声音Windows自带的录音机图1-1 基于PC机的语音信号录制过程本设计分别在安静环境和噪杂环境下录制自己的一段语音,内容相同,均为“语音信号处理”,保存在MATLAB软件的工作目录下,分别命名为“xinhao.wav”和“zaosheng.wav”2. 语音信号的时、频域分析2.1 语音信号的时域分析2.1.1 语音信号的时域波形语音信号的时域分析就是分析和提取语音信号的时域参数。进行语音
5、分析时,最先接触到并且也是最直观的是它的时域波形。语音信号本身就是时域信号,因而时域分析是最早使用,也是应用最广泛的一种分析方法,这种方法直接利用语音信号的时域波形。时域分析通常用于最基本的参数分析及应用,如语音的分割、预处理、大分类等。这种分析方法的特点是:表示语音信号比较直观、物理意义明确。实现起来比较简单、运算量少。可以得到语音的一些重要的参数。只使用示波器等通用设备,使用较为简单等。MATLAB数据采集箱中提供的进行语音信号分析的函数命令如下:wavread:wavread用于读取扩展名为“.wav”的声音文件。其调用形式为:y=wavread(filename)。其作用是读取wave
6、文件,将读取的采样数据送到y中。 sound:音频信号是以向量的形式表示声音采样的。sound函数用于将向量转换为声音,其调用形式为:sound(y,fs),作用是向扬声器送出向量y中的音频信号(采样频率为fs)。通过wavread和plot()函数即可显示语音信号的时域波形。如图2-1所示。图2-1 语音信号的时域波形2.1.2 短时平均能量分析贯穿于语音分析全过程的是“短时分析技术”。因为,语音信号从整体来看其特性及表征其本质特征的的参数均是随时间而变化的,所以它是一个非平稳过程,不能用处理平稳信号的数字信号处理技术对其进行分析处理。但是,由于不同的语音是由人的口腔肌肉运动产生的,相对于语
7、音频率来说是非常缓慢的,所以从另一方面来看,虽然语音信号具有时变特性,但是在一个短时间范围内(一般可认为在1030ms的短时间内),其特性基本保持不变即相对稳定,因而可以将其看作是一个准稳态过程,即语音信号具有短时平稳性。所以任何语音信号的分析和处理必须建立在“短时”的基础上,即进行“短时分析”,将语音信号分为一段一段来分析其特征参数,其中每一段称为一“帧”,帧长一般取为1030ms。这样,对于整体的语音信号来讲,分析出的是由每一帧特征参数组成的特征参数时间序列。一般每秒的帧数约为33100帧,视实际情况而定。分帧虽然可以采用连续分段的方法,但一般要采用交叠分段的方法,这是为了使帧与帧之间平滑
8、过渡,保持其连续性。前一帧和后一帧的交叠部分称为帧移。帧移与帧长的比值一般取为01/2。分帧是用可移动的有限长度窗口进行加权的方法来实现的,这就是用一定的窗函数w(n)来乘s(n),从而形成加窗语音信号Sw(n)=s(n)w(n)。在语音信号数字处理中常用的窗函数是矩形窗和汉明窗等,它们的表达式如下(其中N为帧长):矩形窗: (2-1)汉明窗: (2-2)这两种窗函数都有低通特性,通过分析这两种窗的频率响应幅度特性可以发现:矩形窗的主瓣宽度小,具有较高的频率分辨率,旁瓣峰值大,会导致泄漏现象;汉明窗的主瓣宽8*pi/N,旁瓣峰值低,可以有效的克服泄漏现象,具有更平滑的低通特性。因此在语音频谱分
9、析时常使用汉明窗,在计算短时能量和平均幅度时通常用矩形窗。语音信号的时域参数有短时能量、短时过零率、短时自相关函数和短时平均幅度差函数等,这是语音信号的一组最基本的短时参数,在各种语音信号数字处理技术中都要应用。在计算这些参数时使用的一般是方窗或汉明窗。由于时间有限,本设计只对短时能量进行简单分析。由于语音信号的能量随时间变化,清音和浊音之间的能量差别相当显著。因此对语音的短时能量进行分析,可以描述语音的这种特征变化情况。定义n时刻某语音信号的短时平均能量En为: (2-3)其中N为窗长,可见短时能量为一帧语音样值点的加权平方和。特殊地,当窗函数为矩形窗时,可简化为: (2-4)本课程设计中录
10、制的语音信号在矩形窗长N=400时的短时能量如下图2-2所示:图2-2 N=400时的短时能量短时平均能量的主要用途如下: 可以作为区分清音和浊音的特征参数。实验结果表明浊音的能量明显高于清音。通过设置一个能量门限值,可以大致判定浊音变为清音或者清音变为浊音的时刻,同时可以大致划分浊音区间和清音区间。在信噪比较高的情况下,短时能量还可以作为区分有声和无声的依据。可以作为辅助的特征参数用于语音识别中。2.2 语音信号的频域分析语音信号的频域分析就是分析语音信号的频域持征。从广义上讲,语音信号的频域分析包括语音信号的频谱、功率谱、倒频谱、频谱包络分析等,而常用的频域分析方法有带通滤波器组法、傅里叶
11、变换法、线件预测法等几种。本文介绍的是语音信号的傅里叶分析法。因为语音波是一个非平稳过程,因此适用于周期、瞬变或平稳随机信号的标准傅里叶变换不能用来直接表示语音信号,而应该用短时傅里叶变换对语音信号的频谱进行分析,相应的频谱称为“短时谱 ”在MATLAB的信号处理工具箱中函数FFT和IFFT用于快速傅立叶变换和逆变换。函数FFT用于序列快速傅立叶变换,其调用格式为y=fft(x),其中,x是序列,y是序列的FFT,x可以为一向量或矩阵,若x为一向量,y是x的FFT且和x相同长度;若x为一矩阵,则y是对矩阵的每一列向量进行FFT。函数FFT的另一种调用格式为y=fft(x,N),式中,x,y意义
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- MATLAB 应用 专题 实践 课程设计 基于 语音 信号 分析
链接地址:https://www.31doc.com/p-5015169.html