《MPEG_基础理论和协议分析.ppt》由会员分享,可在线阅读,更多相关《MPEG_基础理论和协议分析.ppt(119页珍藏版)》请在三一文库上搜索。
1、MPEG 基础理论 和协议分析,2007年7月,【提纲】,MPEG的介绍 视频压缩 音频压缩 基本数据流 打包基本数据流 节目流 传输流 MPEG检测,MPEG的介绍,MPEG是运动图象专家组的简称,它是由ISO(国际标准组织)就压缩专题而建立的。 MPEG 是当今最流行的音频/ 视频压缩技术之一。,压缩目的,降低存储 对于给定的一段源内容而言,只需 要较小的存储量。 降低带宽要求 在实时工作状态下,压缩技术降低 了所需的带宽。,视频压缩介绍,在所有实际的节目内容中有两种信号分量:一种是异常而无法预见的,另一种是可以预见的。异常分量叫作熵,它是信号中的真实信息。余下的部分叫作冗余,因为它不是必
2、需的。,冗余,冗余可能是空间性的,它位于画面的大片单色区域中,相邻的象素几乎具有相同值。 冗余也可能是时间性的,它是连续画面间相似部分使用的地方。 视频压缩主要是利用空间性和时间性冗余的特点 。,所有压缩系统的工作方式都是在编码器中将熵从冗余中分离出来。只有熵 被录制或传输,而解码器则计算传输信号中的冗余。,MPEG编码特点,MPEG的特点在于它不是单个的压 缩格式,而是各种标准化编码工具,能够灵活地组合起来以适用于各种应用场合。所进行的编码方式也被包括在压缩数据中,所以不论编码器如何工作,解码器均能自动地进行处理。,帧内编码,帧内编码是一项利用空间性冗余或画面中冗余的技术; 帧内编码需要对图
3、象中的空间频率进行分析,产生描述每个空间频率大小的系数。一般来讲,许多系数均为零,或接近于零。这些系数可以被省略,从而使数据率降低。,帧间编码,帧间编码则依赖于找到连续画面的相似之处。如果解码器中有了一个画面,那么下一个画面可以通过仅仅发送画面差异来创建。当物体移动时,画面差异会增加,但由于移动物体在画面之间一般不大改变其外形,所以画面差异的大小可以通过运动补偿来抵销。,音频压缩介绍,PCM 数字音频通道的数据率仅为每秒一兆左右。当使用适度视频压缩方案时,音频压缩就不必要了。但当视频压缩系数上升时,也就必需压缩音频了。,听觉遮蔽,人类的听觉在时间不稳定辨别和频率辨别之间采取了一种折衷,但其能力
4、不是完美无缺的。这种不完美的频率辨别造成无法区分邻近的频率,这就叫作听觉遮蔽,定义为在另一声音存在时对一声音的灵敏度降低。,音频压缩利用了两个事实的优势: 首先,在典型的音频信号中并非所有频率会同时出现。 其次,遮蔽现象使人耳不能辨别特定的音频信号。同时遮蔽阻止或降低了特定频带的可听度,从而使需要发送的数据变得更少。,MPEG信号,单个MPEG音频或视频编码器的输出叫作基本数据流(ES)。基本数据流是一个无限接近实时的信号。 它在“打包基本数据流(PES)”中又被分割成大小合适的数据块。这些数据块需要报头信息以识别打包数据的开始,还必须包括时间标记,因为打包破坏了时间轴。,需要监视和分析,如果
5、使用MPEG传输流的系统发生故障,那么故障可能发生在编码器、多路调制器或解码器中。,压缩的缺陷,MPEG 压缩在解码时会出现损耗,不能达到与原始内容完全一致。 压缩系统会在解码后留下看得见的副产物。,解决这些问题的唯一办法就是降低压缩系数。所以,压缩技术的使用者必须在高压缩系数的经济性和副产物程度之间作出价值判断。,【提纲】,MPEG的介绍 视频压缩 音频压缩 基本数据流 打包基本数据流 节目流 传输流 MPEG检测,时间、空间性编码,在MPEG中,首先通过使用连续画面间的相似之处降低时间性冗余。再通过使用已发送画面中的信息尽可能多地创建和“预见”当前画面。当使用该项技术时,我们仅需要发送差异
6、画面,从而消除了实际画面和预见画面之间的差异。差异画面然后被进行空间压缩。,空间性编码,空间性编码的第一步是用变换方法对空间频率进行分析。变换的输出是描述一给定频率出现多少的一整套系数。逆向变换则重现原始波形。如果各系数得到精确处理,那么逆向变换的输出就与原始波形完全一致。,离散余弦函数(DCT),离散余弦函数(DCT)是余弦变换的取样形式,在MPEG的二维格式中被广泛应用。一个8 x 8象素块经变换后成为了8 x 8系数块。由于变换需要乘上分数,所以字长会增加,导致系数比象素值有更长的字长。一般来说,8 比特象素块会产生11比特系数块。所以,DCT不会导致任何压缩,事实上它会产生相反的效果。
7、然而DCT可以将源象素转变为更容易压缩的形式。,加权,人类对画面中噪声的感觉并不是一致的,而是空间频率的函数。在高空间频率的情况下,可以容忍更多的噪声,而在大块色区域中则很容易看到。 传统的噪声测量往往被加权,使技术测量与主观结果相关联。通过加权处理,可以有效地提高低频率系数的精度。,在编码器中,代表低空间频率的系数用相对较小的步长进行再次量化,并伴有稍稍增加的噪声。代表高空间频率的系数用对较大的步长进行再次量化,并伴有较大的噪声。 在解码器中会加上低次序零来将加权的系数返回到其正确值。然后这些系数将乘以反向加权系数。显然高频率处乘的系数会较大,从而使再次量化噪声变得较大。量化误码在高频率下比
8、在低频率下要大得多。,遍历,先把所有非零系数发送出去,再以一个编码表示所有剩下的部分均为零,那么传送的效率将更大。遍历便是一项能够增加达到该目的可能性的技术,因为它是将系数按大小的可能性的降序排列递送。,熵编码,主要包括两种编码方式: 运行长度编码(RLC) 可变长度编码(VLC),运行长度编码(RLC),尽管使用了遍历,但零系数仍然会在有效的数值之间出现。运行长度编码(RLC)能够让这些系数得到更有效的处理。当重复数值出时,比如有一连串零,那么运行长度编码将只传送零值的数量,而不是传送每个单独比特。,可变长度编码,在实际应用中,有些数值经常出现,而有些数值不常出现。这些统计信息可以帮助我们用
9、可变长度编码(VLC)实现进一步的压缩。经常出现的数值被变换成短码字,而不常出现的数值被变换成长码字为了帮助不连续的情况,任何码字均不是另一个码字的字头。,空间性编码器,上图将前面讨论的所有空间性编码概念联系了起来。 (1) 假设输入信号为4:2:2SDI(串行数字接口),字长可能为8 位或10 位。MPEG只使用8 位分辨率,所以在SDI 信号含有10位字长时需要进行取舍。大多数MPEG 组态用4:2:0 (YUV的值)的取样方式进行工作,所以就需要转换。,(2)在DCT 阶段是将画面信息变为频域,而DCT本身并没有完成任压缩。 (3)DCT之后,系数被加权和截除(量化),从而实现第一次有效
10、压缩。 然后进行之字形遍历以增加有效系数在扫描中率先出现的可能性(遍历)。,(4)在运行长度编码和可变长度编码中系数数据被进一步压缩(熵编码)。 (5)缓冲存储器则用来缓解编码中数据率变化的困难。,量化与缓存的相互关系,在可变数据率系统中,量化是固定的,但在固定数据率系统中,缓冲存储器则用来缓解编码中数据率变化的困难。如果缓冲区有过载危险的话,再次量化步长就要变大,以便使压缩系数有效增加。,时间行编码,如上图所示,与减法器配合的单幅画面延迟存储可以计算画面差异。画面差异是在其右边的图象,可以如前面讨论过的那样由空间性编码器进一步压缩。解码器将空间性编码反过来,并在上一幅画面上加上差异画面以构成
11、下一幅画面。,运动补偿,运动会降低画面之间的相似性,因而需要增加创建差异画面所需要的数据。运动补偿则是用来增加画面的相似性。,当一个物体在电视屏幕上通过时,它可能在每幅画面上出现在不同的位置,但其本身的外形并没有多大的改变。因此,画面差异被以矢量的方式送往解码器。解码器使用该矢量将上一幅画面的一部分移至新画面中更恰当的位置上。,双向编码,物体移动时,它的前部边缘会遮盖掉背景,而尾部边缘会再现背景。再现的背景就需要传送新的数据,因为该背景区域前面被遮盖了,从前幅画面上就得不到任何信息。,双向编码,MPEG可以通过使用双向编码帮助 我们克服这一问题,它允许从当前画面以前或以后的画面,以致于前面或后
12、面数据的平均值中获取信息。如果背景被遮盖时,它仍会在以后的画面中出现。我们可以及时向后移动获取信息,从而创建较早的画面。,I、P和B帧,I 帧画面是指帧内编码画面,解码时不需要其它额外的信息。与其它画面类型作比较,I 画面需要许多数据,所以只是在需要时才发送I画面。I 画面主要由变换系数组成,不含矢量。它允许观众变换频道,并防止误码的传递。,P 画面是指从前面画面中得到的前向预计画面,前面画面可以是I 画面或P 画面。P 画面数据由矢量所组成,而不是由变换系数所组成。P画面需要的数据大约是I画面的一半。,B画面是指从前后的I画面或P画面上双向预见的画面。B 画面数据由描述在前面或后面的画面数据
13、中提取的矢量所组成。B 画面包含变换系数,用于校正。由于双向预见非常有效,所以校正数据是最小的。B画面需要的数据大约是I画面的四分之一。,GOP即画面组。画面组由I画面开头。然后P画面间隔排列。余下的画面是B画面。一个GOP的结束被定义为下一个I画面前的最后一个画面。GOP的长度是很灵活的。,双向编码需要不按顺序地发送画面数据和暂时存储画面数。P 画面数据在B 画面数据之前发送。请注意,GOP中最后的B画面在下一个GOP的I 画面出现之前不能被发送,这是因为需要该数据进行双向解码。为了使画面返回到其正确的顺序,每个画面均包含一个时间性参考值。,MPEG压缩器,下面我们将要介绍的是典型的双向运动
14、补偿器结构。预处理的输入视频输入一系列能够旁通以改变画面顺序的帧储存。然后数据再输入到减法器和运动估算器中。,创建I画面,为了创建I 画面(见上图),我们选择输入延迟的末端并关闭减法器,使数据直接通过进行空间编码。减法器的输出数据也进入保持多个画面的帧储存。I 画面被保持在储存器中。,创建P帧,为了编码P 画面(见上图),输入缓冲区中的B画面被旁通以便选择将来画面。运动估算器比较输出储存中的I 画面和输入储存中的P 画面,以便创建向前运动矢量。I画面通过这些矢量移动,以制作预见P画面。实际P 画面减去预见P 画面就得到预见误码,该误码经空间性编码后与矢量一起发送。预见误码也被加到预见P画面上以
15、创建本机解码P 画面,它也被输入到输出存储中。,创建B画面,此时输出存储中含有一个I 画面和一个P 画面。现在可以从输入缓冲区中选择B 画面。运动补偿器(见上图)会将B 画面与前面的I 画面和后面的P 画面进行比较,从而获得双向矢量。然后进行向前和向后的运动补偿,产生两个预见B画面。当前B 画面再减去这些预见B画面。在逐个宏块的基础上,根据哪个数据代表最小的差异来选择向前和向后数据。接着,画面差异空间编码后与矢量一起发送。,预处理,我们要避免任何会引起不需要运动的操作。如果需要高压缩系数,那么副产物的电平会增加,尤其当输入质量很差时更是如此。在这种情况下最好使用预滤波来降低进入编码器的熵。 视
16、频信号经过双向低通滤波能降低所需的系数数量和副产物电平。画面轮廓将不很明显,但对副产物高电平来说我们还是愿意作出这一选择。,类和级,MPEG适用于大量需要不同性能和复杂性的应用场合。使用MPEG中定义的所有编码工具可以有上百万种可能的组合。在实际应用中,MPEG-2标准被分为各个组态(类),每个组态又分为不同的层(级) 。组态基本上是整个具备一定复杂性的编码指令表的子集。层则是与组态一起使用的参数,如画面尺寸或数据率。,主组态有很大的用处。低层使用低分辨率输入,每行只有352个象素。大部分广播应用需要MPEG 的MPML(主层的主组态)子集,支持SDTV(标准密度电视)。,【提纲】,MPEG的
17、介绍 视频压缩 音频压缩 基本数据流 打包基本数据流 节目流 传输流 MPEG检测,听觉机制,人类听觉的频率范围,通常从20Hz 到大约15kHz。 人耳越能辨别两种频率,则越难以辨别两个事件发生的时间区别。人类的听觉在时间不稳定辨别和频率辨别之间采取了一种折衷,其能力不是完美无缺的。 不完美的频率辨别造成无法区分邻近的频率,这就叫作听觉遮蔽,定义为在另一声音存在时对一声音的灵敏度降低。,声音出现后至少一秒种后才能被听见。由于反应速度慢,所以即便两个信号非同时出现时也会产生遮蔽。当遮蔽声音在其实际长度前后继续遮蔽较低电平声音时就会发生前向或后向遮蔽。,遮蔽能够提高了听觉的阀值。 阀值在较高频率
18、和某些较低频率情况下会上升。,亚能带编码,频带分解压缩扩展器是一套窄带线性相位滤波器,它们相互交叠,并具有相同的带宽。每个带的输出由表示波形的取样物组成。,在每个频率带中,音频输入在传送之前先放大至最大电平。然后,每个电平再返回到其正确的值。传送中的噪声在每个带中均降低。如果将降低的噪声与听觉的阀值相比较,我们可以发现由于遮蔽作用使一些频带能容忍较大的噪声。因此,在经过压缩扩展的每个频带中可以降低取样的字长。由于因分辨力损失引入的噪声被遮蔽,所以该项技术能够实现一种压缩。,MPEG第一层面,在MPEG 第一层面中使用的简单频带分解编码器。数字音频输入被送到频带分解滤波器中,滤波器将信号频谱分成
19、32个频带。时间轴被分割成相同长度的块。 在每个频带中,电平通过乘法放大到最大值。所需的增益在一个块的长度中保持恒定,且单个度量系数与每个频带的每一块一起发送,以便在解码器中实现反向处理。,滤波器组的输出也经过分析确定输入信号的频谱。该分析决定是遮蔽类型,即每个频带中能够预期的遮蔽程度。能够实现的遮蔽越大,在每个频带中取样物的精度可能越差。通过重新量化可降低取样物的精度,从而减少字长。字长的减少对频带中的每个字都是固定的,但不同频带则可能使用不同的字长。,上图显示了一个MPEG 第一层面音频数据流。在同步图案和报头信息之后有每次4位共32位的定位编码。这些编码描述了每个亚能带中的取样物的字长。
20、紧跟着的是在每个频带压缩扩展时使用的32 个度量系数。这些度量系数决定了解码器为了将音频返回到正确电平所需要的增益。度量系数后面依此跟着每个频带中的音频数据。,上图显示的是第一层面解码器。定时发生器检测同步图案,从而得到比特定位和度量系数。然后比特定位数据允许转换成可变长度的取样。通过度量系数数据将重新量化和压缩反变换,使每个频带都回到正确的电平。接着,32 个不同的频带在组合滤波器中被组合起来产生音频输出。,MPEG第二层面,当使用频带分解滤波器决定遮蔽类型时,频谱分析可能不是非常精确。在最坏的情况下遮蔽可能不起作用,所以噪声比无法上升很多。 在MPEG第二层面中,频谱分析由一些不同的处理过
21、程组成。,当块压缩扩展方案与第一层面中的完全一样时,并非所有度量系数均被发送,这是因为度量系数中含有一些真实节目内容上的冗余。在内容固定的节目中,三个度量系数中只发送一个。随着亚能带中瞬变内容的增加,就要发送两个或三个度量系数。该项技术有效地使度量系数数据率降低了一半。,变换编码,第一层面和第二层面均以频带分隔滤波器为基础,信号仍然表现为波形。然而,第三层面采用了与视频编码相似的变换编码。,对于较高的压缩因素而言,系数会被重新量化,使精确度下降。该项处理会产生位于遮蔽最大的频率上的噪声。变换编码器的副产物是输入频谱能够精确获知,从而可以建立准确的遮蔽模式。,MPEG第三层面,在需要最高的压缩系
22、数时,我们就要求有这种复杂层的编码。它与第二层面有一定程度的相似性,使用离散余弦变换,每块含384 个输出系数。,该输出可以通过直接处理输入取样来获得,但在多层编码器中则可以使用与第一层面和第二层面32频带滤波相互配合的混合变换作为基础。如果这样做了,那么QMF(正交镜面滤波器)上的32个亚能带将每个由12 频带MDCT(修正离散余弦变换)进一步处理,从而获得384 个输出系数。,AC-3,AC-3音频编码技术与ATSC系统(美国先进电视系统委员会)一起使用,用来替代MPEG音频编码方案之一。AC-3是以变换为基础的系统,其通过重新量化频率系数获得编码增益。,【提纲】,MPEG的介绍 视频压缩
23、 音频压缩 基本数据流 打包基本数据流 节目流 传输流 MPEG检测,基本数据流,基本数据流基本上是编码器的原始输出,包含只是解码器必需的接近原始画面或音频的信息。MPEG中已严密地定义了压缩信号的句法,所以能够确保解码器很好地运行。编码器虽未被定义,但它必生正确的句法。,视频及本数据流句法,画面的报头信息定义了画面是I 、P 或B 编码,并且包含时间基准,使画面能够在正确的时间呈现。 画面可以组合成必须由一个I 画面开始的GOP(画面组)。GOP是时间性编码的基本单位。在MPEG标准中,GOP可以选择使用,但实际上是必要的。在两个 I 画面之间会放置数量不等的P 画面和/ 或B 画面。,如果
24、使用GOP,几个GOP可以组成一个视频序列。该序列由序列起始编码开始,后面跟着是序列头,并且以序列末端编码结尾。额外的序列头可以放置在序列中。该方法可以使解码从序列的某段开始。 序列头就是解码器开始正确操作的进入点。,音频基本数据流,各种类型的音频可以嵌入到MPEG-2 多路复接中。这些类型包括根据MPEG第一、第二、第三层面或AC-3编码的音频。使用的音频编码类型必须包含描述符,以便解码器在调用合适的解码类型时读取信息。,音频压缩处理和视频压缩处理有很大的不同。它没有象I、P和B帧类型那样不同的情况,并且音频帧都含有相同数量的音频数据。它也没有双向编码,并且音频帧必须按顺序发送。,【提纲】,
25、MPEG的介绍 视频压缩 音频压缩 基本数据流 打包基本数据流 节目流 传输流 MPEG检测,打包基本数据流(PES),在实际应用中,载有从压缩器中得到的视频或音频的连续基本数据流需要分割成数据包。这些数据包用含有同步时间标记的报头信息来辨别。PES 数据包能够用来创建节目流或传输流。,在打包基本数据流(PES)中,无长度限制的基本数据流根据不同的应用场合分割成大小合适的数据包。数据包的大小可能是几百个千字节,但它会根据不同的应用场合而变化。 每个数据包之前有一个PES数据包报头。请不要将PES中的数据包和传输流中使用的小得多的数据包混淆起来,即便它们有着相同的名字。,由于MPEG只定义了传输
26、流,而没有定义编码器,所以设计者要选择建立多路复接器, 进一步将基本数据流转变成传输流。在这种情况下,PES 数据包可能没法识别,但它们在逻辑上存在于传输流有效负载之中。,时间标记,为了保持音频和视频锁定在一起,在每幅面画中定期插入了时间标记。 时间标记是一个33比特数字,它是由90kHz 时钟驱动的计数器的取样。因为呈现的次数是平均分布的,所以不必在每个呈现单元中包括时间标记。时间标记也能够由解码器插入,但无论在节目流还是传输流中,它们之间的间隔必须不能超过700ms。,时间标记是指特定的进入单元属于哪一时间段。我们通过在视频或音频数据包的报头插入时间标记而获得边沿同步。当解码器收到所选择的
27、PES数据包时,它便对每个进入单元进行解码,并缓冲寄存到RAM中。当时间行计数达到时间标记的值时,RAM便读出。该操作有两个作用。首先,每个基本数据流中都能获得有效的时基校正。其次,视频和音频基本数据流可以同步到一块儿做成节目。,PTS/DTS,在使用双向编码时,一个画面可能不得不在其呈现前的一段时间被解码,所以它可以作为B 画面的数据源。所以共有两种时间标记存在。解码时间标记(DTS)是指画面必须被解码的时间,而显示时间(PTS)是指画面必须呈现到解码器输出上的时间。,由于B 画面是同时被解码和显示的,所以只含有PTS。 在数据包的报头设置PTS/DTS 标记是为了指明只有PTS 存在还是P
28、TS和DTS时间标记同时存在。音频数据包可能含有多个进入单元,数据包头部含有一个PTS。由于音频数据包总是按顺序发送的,所以音频数据包中没有DTS。,【提纲】,MPEG的介绍 视频压缩 音频压缩 基本数据流 打包基本数据流 节目流 传输流 MPEG检测,节目流,节目流是将几个PES 打包数据流组合在一起的办法,在如DVD 的录制应用场合中有明显的优点。,录制和传送,对于给定的画面质量而言,压缩视频的数据率将随着画面内容的变化而变化。可变数据率频道能够产生最佳的效果。在传送过程中,大多数的应用频道都是固定的,整个数据率通过使用填充数据(无意义数据)保持不变。 在DVD中使用填充数据是对存储能力的
29、浪费。 然而,存储介质能够从物理角度上或在磁盘驱动器中满足改变数据传送率要求,放慢或提高读取速度。这种方法能够在不影响存储能力的情况下获得可变数据率频道。这种技术只是当音频和视频以相同的时钟编码时才有效,否则它们会在录制长度上滑动。,为了满足这些不一致的要求,节目流和传输流被设计成可替换的。节目流在数据率可变的录制环境中的单个节目上起作用,而传输流在数据率固定的传送环境中的多个节目上起作用。 在DVD播放机中不存在与信号源强制同步的问题。在传送过程中,解码器需要对编码器重建时基。因此,传输流使用节目时钟参考(PCR),而节目流则不需要节目时钟。,节目流的介绍,目流是一个PES 打包复接,载有多
30、个用相同主时钟或系统时钟进行编码的基本数据流。该数据流可能是视频数据流和与其相关的音频数据流,或者是多频道只有音频的节目流。基本视频数据流被分成进入单元(AU),每个进入单元含有描述一幅画面的压缩数据。这些画面被识别为I、P 或B,每个画面载有一个进入单元号码来指示正确的播放顺序。一个视频进入单元成为一个节目数据流包。在视频中,这些包的大小会变化。例如,I画面包的大小比B 画面包大得多。,数字音频进入单元通常大小相同,几个数字音频进入单元成为一个节目流包。这些包不应该与传输流包混淆起来。后者要小得多且大小固定。视频和音频进入单元边界与时间轴很少相吻合。但因为每个边界有其各自的时间标记结构,所以
31、这种不吻合是没有问题的。,【提纲】,MPEG的介绍 视频压缩 音频压缩 基本数据流 打包基本数据流 节目流 传输流 MPEG检测,传输流的工作,传输流承载着许多不同的节目,每个节目可能使用不同的压缩系数和数据率,该数据率即使在整个数据率保持不变的情况下也会动态改变。这种做法叫作统计复用,它可以允许处理复杂内容的节目从处理简单内容的节目中借用带宽。 传输流必须为每个节目提供不同的同步方式。这个额外的同步方法叫作节目时钟参考(PCR),它能重建稳定的参考时钟,并可分割创建解码器的时间行,所以每个节目中的基本数据流的时间标记就变得非常有用。总之,节目的一个定义就是共享同一定时参考的一套基本数据流。,
32、数据包,传输流数据包的结构:其大小是固定的188 个字节,常常被分为报头和有效负载,最小包头是4 个字节。,在这个头部中最重要的信息是: 同步字节。该字节由解码器识别,使报头和有效负载可相互分离。 传输误码指示器。当传输层上面的误码校正层遇到过高而无法校正的原始数据误码时才设定该指示器。它指出可能存在误码的数据包。,数据包识别(PID)。这个13比特编码用来识别不同类型的数据包。 连续计数器。每次发送含有相同PID 的新数据包时,编码器便递增这4个 比特值,它用来判断是否有数据包丢失、重复或次序发生变化。,节目时钟参考(PCR),数据包报头中的匹配场周期性地包含PCR(节目时钟参考)编码,用来
33、产生解码器的锁定时钟。 MPEG 要求PCR 至少以每秒10 个PCR的速率发送。,编码器时钟稳定地驱动运行的二进制计数器。这些计数器的值被定周期地取样,并作为PCR放在报头匹配场中。在解码器中,VCO(压控振荡器)产生一个标称的27MHz时钟,它驱动本机PCR计数器。与数据包报头的PCR加以比较,其差异就是PCR相位误差。我们滤出该误码来控制VCO,从而逐渐使本机PCR 计数与报头PCR 相配。,数据包识别(PID),传输数据包报头的一个13比特场包含了数据包识别编码(PID)。解多路复接器用PID 来区分含有不同信息类别的数据包。传输流的数据率必须是固的。该要求通过使用零数据包来实现。零数
34、据包的有效负载中全部是零。如果实际有效负载率下降时,就插入更多的零数据包。,节目专用信息(PSI),PSI 承载于含特定PID 的数据包之中。PSI已被标准化了,而有些内容则由节目关联表(PAT)和有条件进入表(CAT)来规定。这些数据包必须周期地包含在每个传输流中。PAT的PID总是为0,而CAT的PID总是为1。这些PID 值和零数据包PID的8191值是整个MPEG系统中唯一的固定PID 值。解多路复接器必须通过进入合适的表来确定所有余下的PID。,节目关联表(PAT)数据包(PID=0)中列出了传输流中存在的节目流,PAT 指定了所有节目映像表(PMT)数据包的PID。 授权控制信息(
35、ECM)的PID 和授权管理信息(EMM)的PID列在有条件进入表(CAT)数据包(PID=1)中。,一个给定网络信息表(NIT)包含的内容不仅仅是承载它的传输流,还包括同一解码器所能获得的其它传输流,NIT 可能列出一些其它传输流数目,每个含有一个描述符,指定无线电频率、轨道位置等等。在MPEG中只有NIT 是强制性设定的。,通过读取PAT,解多路复接器可以找到网络信息表(NIT)和每个节目映像表(PMT) 中的PID 。找到了PMT,解多路复接器便可找到每个基本数据流的PID。因此,如果要解码一个特定的节目流,我们就先要参考PAT,然后只需要PMT 来寻找节目中所有的基本数据流的PID。如
36、果节目被加密,则还需要进入CAT。,【提纲】,MPEG的介绍 视频压缩 音频压缩 基本数据流 打包基本数据流 节目流 传输流 MPEG检测,检测要求,当出现故障时,故障的位置要能够被迅速找到。为了更好地进行设备设计,我们需要对问题的本质作进一步探讨。 在本章中要讨论的内容为:压缩数据的协议分析和画面质量评估。,分析传输流,许多类型的分析可在实况传输流中实时地进行。它们包括显示传输流中的节目层级和显示分配到每个数据流中的数据流数据率份额。 如果要进行更详细的分析,必须将部分传输流录制下来,以便以后进行各项参数剖析。该项技术叫作延时检测,常用于如检查时间标记的内容。,分层观察,句法和CRC 分析,
37、传送节目内容时,传输流必须完全依赖于编码器对句法的正确使用。如果没有正确设定固定的标记比特、同步图案、数据包起始码和数据包计数,解码器就可能错误地解释数据流。句法检查功能会考虑所有非节目内容的比特,并显示任何的不符点。伪不符点可能是由于传送误码造成的;而固定的不符点则是由编码器或多路调复用器故障造成的。,筛选,传输流含有大量数据,即便在实际发生故障的情况下,除非存在严重的问题,否则许多数据都可能是有效的,而只有一个基本数据流或一个节目受到影响。在这种情况下,进行有选择的检测更为有效,这就是筛选的功能。通过筛选数据包头信息,可以使我们仅仅分析含一个给定PID的数据包。,定时分析,要正确地显示实时
38、音频和视频,传输流必须向解码器传送正确的定时。该项任务可以通过分析PCR 和时间标记数据加以确认。,为了测量抖动,分析仪需要利用前面的PCR值和比特率来预计PCR值,产生所谓的插入PCR 或PCRI 。PCRI 减去实际的PCR 值就得到抖动的评估值。,在MPEG中,不同画面类型的重新排列和使用会造成延迟,并需要在编码器和解码器中缓冲。一个给定基本数据流的编码必然会受到解码器缓冲能力的制约。MPEG定义的标准解码叫作T-STD(传输流目标解码器);编码器或重复多路复用器不能超出TST-D 缓冲能力的限制而使数据失真。传输流包含了叫作VBV(视频缓冲证实)的系数,规定了一个给定基本数据流需要的缓
39、冲量 。,基本数据流检测,要使检测的结果有意义,需要两个工具: 能够仔细探查整个编码范围的已知符合要求的检测信号源。这些信号必须是确定的,从而使解码器故障能够重复出现。萨尔诺夫的顺应性测试数据流就是设计用来完成该项任务。 基本数据流分析仪,可以检查编码器上的整个句法是否符合要求。,萨尔诺夫顺应性测试数据流,这些数据流由萨尔诺夫研究中心特别设计,用于检测解码器的顺应性测试。它们可以多路复用到传输流中送往解码器。全套萨尔诺检测可以用来依次检查所有MPEG句法的基本单位。,基本数据流分析,基本数据流分析可以从句法的最上层开始,再向下继续进行。序列的报头信息由于能够告诉解码器所有压缩中使用的相关模式和参数,所以非常重要。,创建传输流,在怀疑解码器时,最有用的是产生一个已知质量的检测信号。MPEG传输流必须包括节目特定信息(PSI),如PAT、PMT和NIT,用来描述一个或多个节目流。每个节目流必须包含自身的时钟参考(PCR),基本数据流还需具有周期时间标记。,抖动,MPEG解码器需要通过使用PCR数据中的时钟信息来重新创建连续时钟,用以驱动锁相环。环路需要经滤波和衰减使PCR 数据到达时的定时抖动不至于造成时钟的不稳定。 为了检测相位锁定环路的性能,我们需要一个带有已知抖动的信号,否则检测就没有意义了。,
链接地址:https://www.31doc.com/p-5019887.html