多带激励语音编码SA5.0C-BPDF资料的实现.doc
《多带激励语音编码SA5.0C-BPDF资料的实现.doc》由会员分享,可在线阅读,更多相关《多带激励语音编码SA5.0C-BPDF资料的实现.doc(4页珍藏版)》请在三一文库上搜索。
1、多带激励语音编码SA5.0C-BPDF资料的实现虽然现在已经有光纤通信等大容量通信手段,但是,在移动通信、卫星通信、军事通信中,节省带宽仍然非常重要。传统的PCM等占用大量信道带宽的语音编码技术,已远远不能满足现代数字通信的需要。欧美、日本等国一直在努力通过降低语音编码速率来扩大通信系统的容量。在我国,对低速率语音编码技术也有迫切的需要,如保密通信、短波信道、水声信道等对码率要求严格的应用场合。但现有语音编码的国际标准传输速率都较高(一般在8 Kbs以上),而现有的一些低速率语音编码方案的话音质量又不尽人意。因此,如何有效地降低编码速率将一直是重要的研究课题。多带激励语音声码器(MulTIBa
2、nd Excited,MBE)在2.44.8 Kbs速率上能合成出音质比传统声码器好得多的语音,而且具有较好的自然度和容忍环境噪声的能力,是目前这一速率范围内比较理想的参数编码方案。1 MBE编码(语音分析)1.1 MBE模型美国MIT大学林肯实验室1988年提出了多带激励(MBE)语音编码方案。MBE语音模型如图1所示,把激励频谱分成许多互不交迭的频带,对每一频带分别进行二元清、浊音判决,这就是多带激励的由来。这样就允许特定语音帧的激励信号可以是周期能量(浊音)和噪声能量(清音)的混合,在一定程度上增加了模拟激励的自由度,因而使MBE语音模型能产生高质量的语音,而且使MBE语音模型有更强的抗
3、背景噪声能力。1.2参数提取算法MBE语音模型主要参数包括:基音周期;各谐波带清浊音判决信息;各谐波对应谱包络幅度。按照MBE算法原理图(图2),参数提取算法的实现分为如下四个步骤:(1)基音周期粗估基音周期的粗估采用在时域内进行的方法。因为实际计算中证明,频域中计算量特别大,并不好用。为解决这一问题,本文采用时域自相关函数来估计基音周期的方法,这个方法的计算量比频域法少得多,但只能在基音周期的整数点值上进行。MBE算法就是对每一帧语音信号,在基音周期预估值范围内(一般在P=20147之间),计算误差函数Ep(P),使误差函数最小的频率值P就是基音估计的粗估值P1。误差函数:(2)基音周期细搜
4、索基音周期的细搜索采用在频域内进行的方法,可以进一步在频域范围内进行非整数基音周期的估计,从而提高基音周期估计的精度。即在粗估基音P1邻域内进行细搜索,确定更精确的基音周期候选值Pt:P1-98,P1-78,P1+78,P1+98。通过上述算法,可以得到真正基音周期P0。(3)谐波带清浊音判决(UV判决)研究证明,清音带与浊音带不会频繁交替,而是保持着一定的连续性,这样在编码速率较低时,可以将相邻的几个谐波频带划分在一起,共同进行清浊音判决。本文将相邻的3个谐频带划分在一起,整个频带采用最多分成12个带的方法进行清浊判决。判决阈值采用自适应值,如果拟合误差小于阈值,判为浊音,否则判为清音。(4
5、)谱幅度估计确定UV后,就可以对各谐波的包络幅度做最后的确定:2 MBE解码(语音合成)多带激励模型语音合成的方法大体分为两类,即频域合成法与时域合成法。频域合成法先用收到的参数构成重建语音谱,然后利用傅里叶反变换得到时域序列,相当于分析过程的逆过程。这种方法比较直接,但不能保证合成语音基音周期的平滑变化,特别当帧长比较长的时候会产生基音周期跳变,使合成语音不自然。时域合成法能利用插值实现帧与帧之间基音周期平滑过渡,合成出更自然的语音。因此在实际的MBE算法中都采用这种方法。如图3所示,浊音Sv(n)与清音SU(n)是分开合成的,最后将他们相加,形成完整的合成语音SR(n)。本文对于浊音部分的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 激励 语音 编码 SA5 BPDF 资料 实现
链接地址:https://www.31doc.com/p-3418926.html