多媒体音频技术.ppt
《多媒体音频技术.ppt》由会员分享,可在线阅读,更多相关《多媒体音频技术.ppt(36页珍藏版)》请在三一文库上搜索。
1、多媒体音频技术 音频信息处理 第一节 声音的基本概念 n声音是一连续的波,称为声波 n声音的强弱体现在其振幅上,声音的音调的高低体现 在声音的频率上 n声音信号由许多频率不同的信号组成,是复合信号 n声音的带宽:复合信号的频率范围 例如 高保真声音的频率范围为10Hz20 000Hz,其带 宽约为20KHz。 n次音信号 0Hz20Hz,音频信号20Hz20KHz, 话音信号 300Hz3 000Hz,超音频信号:20KHz以上 。 第二节 声音信号的数字化 n模拟信号与数字信号 在时间和幅度上都是连续的信号称为模拟信号 在时间和幅度上都是用离散的数字表示的信号称为数 字信号 n对模拟信号的处
2、理比较复杂,难于精确控制,成本高 。将模拟信号转换成数字信号,处理简单,精确。 n声音信号的数字化 n采样 在某特定时刻对模拟信号进行测量叫采样 每隔相等的一段时间进行采样,称为均匀采样 n量化 把信号幅度划分成若干小段,若每段都是相等的 ,称为线性量化,否则称为非线性量化。 n采样频率 采样频率即取样频率,指每秒钟取得声音样本的次数。采样频率 越高,声音的质量也就越好。人耳的分辨率很有限,所以太高的 频率就分辨不出来了;采样频率一般共分为22.05KHz、44.1KHz 、48KHz三个等级,22.05只能达到FM广播的声音品质, 44.1KHz是CD音质,48KHz则是DVD Audio或
3、专业领域才会采用 。 根据奈奎斯特理论,采样频率不低于声音信号最高频率的两倍。这样就能把 数字表达的声音还原成原来的声音,称为无损数字化。采样定律用公式表示 为 nfs 2f 或者 Ts T/2 其中f为被采样信号的最高频率。 n采样(量化)精度 样本大小是用每个声音样本的位数bit/s(即bps)表示的,它反映度量声音波形 幅度的精度。 既 用样本值的二进制位数来表示。位数越多精度越高,数据也越大。 第三节 音频编码基础 n音频编码分类 音频编码的目的在于压缩数据。在进行压缩时,要在音频质 量、数据量、计算复杂度三方面进行考虑。音频编码的分类 如下: n基于音频数据的统计特性进行编码(波形编
4、译码器) (其目标是使重建语音波形保持原波形的形状。如:PCM (脉冲编码调制)、DPCM(差分脉冲编码调制)、 APCM(自适应脉冲编码调制)、ADPCM(自适应应差分 脉冲编码调编码调 制) n基于音频的声学参数,进行参数编码(音源编译码器) 这类编码数据率低,但质量清晰度低。 上述两种编码算法结合称为混合编码。 n基于人的听觉特性进行编码 n 数据的压缩必然引起音频质量的降低。评 价编码/解码器一般根据以下几个参数:音 频质量、数据率、编码/解码延时和算法复 杂度。 音频编码算法的评价 质量 采样频率 (kHz) 样本精度 (bit/s) 单道声/ 立体声 数据率(kB/s) (未压缩)
5、 频率范围 电话*88单道声8 2003400 Hz AM11.0258单道声11.0 FM22.05016立体声88.2 2015 000Hz CD44.116立体声176.42020 000 Hz DAT4816立体声192.02020 000 Hz 数字音频的质量与采样频率和量化精度有关 。数字音频可分以下几个等级 声音质量的度量 (用带宽度量) 声音质量和数据率 507 000Hz 电话质量AM质量音乐 FM质量 CD质量 对于音频质量的评价分为客观评定和主观评定。客观评定是通过 测量一些特性来评价度量,主要用信噪比(signal to niose ratio,SNR)。 广泛使用的是
6、主观评定,以主观意见打分(Mean Opinion Score MOS)来度量: 分数质量级别失真级别 5优(Excellent)无察觉 4良(Good)(刚)察觉但不讨厌 3中(Fair)(察觉)有点讨厌 2差(Poor)讨厌但不反感 1劣(Bad)极讨厌(令人反感) 声音质量的度量另外两种方法(主/客观评价) 1.概述 MIDI是Musical Instrument Digital Interface的首写字母组 合词,可译成“电子乐器数字接口”。用于在音乐合成器(music synthesizers)、乐器(musical instruments)和计算机之间交换 音乐信息的一种标准协议
7、. MIDI是乐器和计算机使用的标准语言,是一套指令(即命令的 约定),它指示乐器即MIDI设备要做什么,怎么做,如演奏音符、 加大音量、生成音响效果等。MIDI不是声音信号,在MIDI电缆上 传送的不是声音,而是发给MIDI设备或其它装置让它产生声音或 执行某个动作的指令。 MIDI标准下列几个优点:生成的文件比较小,因为MIDI文件存 储的是命令,而不是声音波形;容易编辑,因为编辑命令比编辑 声音波形要容易得多;可以作背景音乐,因为MIDI音乐可以和其 它的媒体,如数字电视、图形、动画、话音等一起播放,这样可 以加强演示效果。 产生MIDI乐音的方法很多,现在用得较多的方法有两种:一种 是
8、(frequency modulation,FM)合成法,另一种是乐音样本合成 法,也称为波形表(Wavetable)合成法 声音的合成 让计算机演奏音乐最简单的方法是采用录音/重放的方式。这种方 法数据量大。另一种方法是采取合成的方式产生音乐。1976年, FM(frequency modulation,FM)调频合成法产生,1984年另一种合成 技术是乐音样本合成法,也称为波形表(Wavetable)合成法产生。 一、调频音乐合成 音乐包括确定的基频谱和这个基频整数倍的谐波谱。这是与噪声不 同的地方。 一个音乐必须有音高、音色、响度和持续时间4个因素。 音高是指声波的基频。基频越低给人的感
9、觉越低沉。 音色是由声音的频谱决定。人们能分辨出相同音高的小提琴和钢琴 的声音,是因为它们的音色不同。小号有较强的穿透力是其声音中的高 次谐波非常丰富。 响度可通过调节声波的整体幅度来实现。 时值的变化导致旋律的进行,或平缓,或跳跃。 通过对上述参数的控制来合成音乐是FM的基本思想。 FM合成器生成乐音的基本原理如图所示。它由5个 基本模块组成:数字载波器、调制器、声音包络 发生器、数字运算器和模数转换器。 声音合成器的波形 各种不同乐音的产生是通过组合各种波形和各种波形参数 并采用各种不同的方法实现的。用什么样的波形作为数字 载波波形、用什么样的波形作为调制波形、用什么样的波 形参数去组合才
10、能产生所希望的乐音,这就是FM合成器的 算法。 1. 改变数字载波频率可以改变乐音的音调, 改变它的幅度可以改变它的音量。 2. 改变波形的类型,如用正弦波、半正弦波 或其它波形,会影响基本音调的完整性。 3. 快速改变调制波形的频率(即音调周期)可 以改变颤音的特性。 4. 改变反馈量,就会改变正常的音调,产生 刺耳的声音。 5. 选择的算法不同,载波器和调制器的相互 作用也不同,生成的音色也不同。 通过改变FM合成器参数,可以生成不同的乐音 二、乐音样本合成声音 使用FM合成法来产生各种逼真的乐音是相当困难的,有些乐音几乎 不能产生,因此很自然地就转向乐音样本合成法。这种方法就是把真实 乐
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多媒体 音频 技术
链接地址:https://www.31doc.com/p-2560767.html