第二章音频信号及其处理.ppt
《第二章音频信号及其处理.ppt》由会员分享,可在线阅读,更多相关《第二章音频信号及其处理.ppt(37页珍藏版)》请在三一文库上搜索。
1、第二章 音频信号及其处理 2.1声音信号 2.2数据压缩基础 2.3语语音编码编码 技术术 2.1.1 声音信号的物理特征 2.1.2 声音信号的数字化处理 2.1.3 电子乐器数字接口(MIDI)系统 2.2.1 数据压缩及其必要性 2.2.2 数据压缩技术的分类 2.2.3 信源的数字化与压缩系统评价 2.2.4 压缩的理论极限 第二章 音频信号及其处理 2.3语语音编码编码 技术术 2.3.1话音编码概要 2.3.2 脉冲编码调制(PCM) 2.3.3 PCM在通信中的应用 2.3.4 增量调制与自适应增量调制 2.3.5 自适应差分脉冲编码调制 2.3.6 子带编码 2.3.7 线性预
2、测编码(LPC) 2.3.8 GSM编译码器简介 第二章 音频信号及其处理 2.1 声音信号 2.1.1 声音信号的物理特征 图201 声音是一种连续的波 1频率和振幅 声音信号又两个基本的参数:频率和振幅。声音按照频率 分为三种类型:次声、可听声、超声。低于20Hz的声音为 次声,或称为亚音信号(subsonic);可听声的声音频率范 围为2020000 Hz;高于20000 Hz的声音为超声,或称超声 波(ultrasonic)信号。多媒体计算机中处理的声音主要指 可听声。频率能反映出声音的声调,我们所听到的声音如 果细尖表示频率高,声音粗低表示频率低。 第二章 音频信号及其处理 一般情况
3、下人说话的话音信号的频率范围在3003000 Hz,称为 话音(speech)信号,在这种频率范围里感知的声音幅度大约在0 120 dB之间。 声音信号的另一个基本参数是振幅,它表示声音信号的强弱。声 音信号的强度相差很大,从可以听见的最弱声到最强声,其强度 相差1万亿倍。声音的强弱采用分贝作为量纲,区别两个强度I和 I0的分贝数(dB)是: 声音分贝数 = 10*log(I/ I0 ) 在心理上,声音有两个最重要的量纲,即响度和音调,其 他还有音色、和谐、不和谐等 第二章 音频信号及其处理 振幅和频率不变的声音信号为单音,或称纯音。我们们将不同 的振幅和频频率合成得到的声音信号称为为复音。
4、2单音和复音 复音 基频:是决定声音音调调的基本因素 谐音 基频和谐音合成复音,形成了声音的不同音质 和音色。 第二章 音频信号及其处理 2.1.2 声音信号的数字化处理 1模拟信号和数字信号 我们把在时间和幅度上都是连续的信号称为模拟信号。 在某些特定的时刻对这种模拟信号进行测量叫做采样(sampling) ,由这些特定时刻采样得到的信号称为离散时间信号。采样得到的 幅值是无穷多个实数值中的一个,因此幅度还是连续的。如果把信 号幅度取值的数目加以限定,这种由有限个数值组成的信号就称为 离散幅度信号。我们把时间和幅度都用离散的数字表示的信号就称 为数字信号。 话筒和摄像机产生的信号为模拟信号。
5、模拟信号经过采样可获得离 散信号。离散信号经模拟/数字转换变成二进制的数字信号。数字 信号就可以直接输入计算机进行处理。 第二章 音频信号及其处理 声音进入计算机的第一步就是数字化,数字化实际上就是采样和量 化。连续幅度的离散化通过量化(quantization)来实现,就是把信 号的强度划分成一小段一小段,如果幅度的划分是等间隔的,就称 为线性量化,否则就称为非线性量化。 声音数字化需要回答两个问题:每秒钟需要采集多少个声音样 本,也就是采样频率(fs)是多少,每个声音样本的位数(bit per sample,bps)应该是多少,也就是量化精度。 图204 声音的采样和量化 第二章 音频信号
6、及其处理 3采样定理 采样频率的高低是根据奈奎斯特理论(Nyquist theory)和声音信 号本身的最高频率决定的。奈奎斯特理论指出,采样频率不应低 于声音信号最高频率的两倍,这样就能把以数字表达的声音还原 成原来的声音,这叫做无损数字化(lossless digitization)。 采样定律用公式表示为 fS = 2f 或者 Ts = T/2 其中f为被采样信号的最高频率。 例如,电话话音的信号频率约为3.4 kHz,采样频率就选为8 kHz。 如果不遵循采样定理,则必然造成误差,通常称为混叠效 应。为了更好地防止混叠效应,一是对信号进行滤波,滤除高频 成分,使信号的最高频率限制在fm
7、ax之内。其二是严格依据定理 ,以2*fmax的频率进行采样。 第二章 音频信号及其处理 4采样精度、采样位数、声道数 采样数据位数(Sampling Data)也称量化精度,是指每个采样点 在A/D转换后所表示的数据范围。常用的采样数据位数有:8bit, 14bit,16bit。位数越少,声音的质量越低,需要的存储空间越少。 采样精度的另一种表示方法是信号噪声比,简称为信噪比 (signal-to-noise ratio,SNR),并用下式计算: SNR 10 log (Vsignal)2 / (Vnoise)220 log (Vsignal / Vnoise) 其中,Vsignal表示信号
8、电压,Vnoise表示噪声电压;SNR的单位为分贝 (dB)。 例1:假设Vnoise1,采样精度为1位表示Vsignal21,它的信噪比 SNR6分贝。 例2:假设Vnoise1,采样精度为16位表示Vsignal216,它的信噪 比SNR96分贝。 第二章 音频信号及其处理 早期的收录机是以单声道进行录放的。如果同时记录两个声道 的信号,即称其为双声道(立体声)录音。立体声技术更能反映 人们的听觉效果,现场真实感强,所以得到广泛应用。 一个声音文件的数据量可由下列公式推导出来: (采样频率*采样数据位数*声道数)/8 = 字节数/秒(B/s) 如果对每个取样的幅度值用R位二进制编码(R比特
9、)表示,就 得到数字信号的传输速率或比特率I,I=fs*R(bit/s 或 b/s) 当信号带宽给定从而fs已知且不变时,传输速率就简单地由采 样位数R来确定。在有关编码的文献及书本中,比特率(或数码率 、码率、速率、数据率)用来表示I和R,具体指哪一个从其量纲 即可以确定,不会混淆。一般传输时多用I,存储时多用R。 容量 第二章 音频信号及其处理 单 声 道立 体 声 16位8位16位8位 44.1 kHz 5.28 M2.64 M10.56 M5.28 M 22.05 KHz 2.64 M1.32 M5.28 M2.64 M 11.025 KHz 1.32 M0.66 M2.64 M1.3
10、2 M 采样频率 容量 表2-1 采样方式与所需占用的存储容量的关系 第二章 音频信号及其处理 5常见的音频信号 常见的音频信号主要有:电话音频信号、 调频调幅无线电广播音频信号和高保真的立体声音频信号。由 于其用途不同,这些音频信号的带宽也各不相同,而且在音响 设备中,通常以带宽来衡量声音的质量。 数字激光唱盘(CD) FM无线电广播 AM无线电广播 电 话 10 20 50 200 3400 7k 15k 20k 图2-05音频信号的带宽 第二章 音频信号及其处理 6质量的评价 客观质量度量:信噪比(signal to niose ratio,SNR) 峰值信噪比(PSNR) 主观质量度量
11、 主观观平均(mean opinion score,MOS)分 综合法,一般以主观为主。 第二章 音频信号及其处理 分数质量级别失真级别 5优(Excellent)无察觉 4良(Good)(刚)察觉但不讨厌 3中(Fair)(察觉)有点讨厌 2差(Poor)讨厌但不反感 1劣(Bad)极讨厌(令人反感) 第二章 音频信号及其处理 7音频信号的标准和规范 表2-04 数字电话的编码标准 组 织ISOCCITTGSMCTIANSA 标 准 G.711G.721G.728 GSMGIA 制定时 间 1992 19721984 1992 19831989 19891982 传输率 Kb/s 12864
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第二 音频 信号 及其 处理
链接地址:https://www.31doc.com/p-2559747.html