第6章图像压缩.ppt
《第6章图像压缩.ppt》由会员分享,可在线阅读,更多相关《第6章图像压缩.ppt(57页珍藏版)》请在三一文库上搜索。
1、第6章 图像压缩,图像压缩,压缩模型 信息理论 无损压缩 有损压缩 图像压缩标准,引言,(一)、图像数据压缩的重要性和必要性: # A4大小300dpi二值扫描1MB # 640*480的24bit真彩色图像0.92MB # 3656*2664的24bit电影胶片29MB #PAL制数字视频20M #高清晰度电视HDTV166MB,(二)、图像数据压缩的应用领域: 1、办公自动化; 2、医学图像处理; 3、卫星遥感遥测系统; 4、高清晰度电视HDTV; 5、可视电话、会议电视; 6、移动多媒体图像及视频传输: 彩信业务,手机视频; 凡是涉及到图像数据的传输、交换与存储的领域均要求进行图像数据的
2、压缩。,(三)、图像中冗余信息的主要表现: 1、图像的空间冗余;-象素间冗余,相同的目标,相同的直方图,象素间的相关性不同,2、图像彩色光谱空间的冗余; 3、视频图像信号在时间上的冗余; 4、图像的视觉心理冗余; 压缩的目的就是去除信息冗余,如何评价图像编码中的解码图像与原始图像之间的偏离程度? 通过保真度(逼真度)准则 两大类准则:客观保真度准则,主观保真度准则,客观保真度准则,当所损失的信息量可用编码输入图像与解码输出图像的函数表示时,基于客观保真度准则的。,常用的准则有: 均方根误差erms 总误差 均方信噪比SNRrms,主观保真度准则,一般情况下,解压图像最终是依靠人的视觉来判断的,
3、用主观保真度准则。,如对电视图像质量进行绝对评价的尺度为,压缩模型,信源编 码器,信道编 码器,信道解 码器,信源解 码器,信道,Encoder,Decoder,输入 图像,f(x,y),Removes input redundancies,Increases the noise immunity,编码器,信息理论,(一)、信源空间概述 1、信息:事物运动状态或存在方式的不确定性的描述; 2、信源空间:随机符号及其出现概率的空间; 3、信源的分类: (1)、 连续信源离散信源混合信源; (2)、无记忆信源有记忆信源(相关信源)有限长度记忆信源(Markov信源),(二)、信息的度量 1、信息公
4、理 (1)、信息由不确定性程度进行度量; 确定事件的信息量为零。 (2)、不确定性程度越高信息量越大; (3)、相互独立性与信息量可加性; 独立事件的联合信息等于两个独立事件的信息总和。 满足上述公理的函数为:,2、离散无记忆信源(DNMS)的信息量度量: (1)信源符号 的自信息量定义为:,(a)、非负性; (b)、信息量的单位: 底为2时单位为:比特(bit) 底为e时单位为:奈特(Nat) 底为10时单位为:哈特,(2)、信源平均自信息量(信息熵) 离散无记忆信源A的平均自信息量(信息熵)定义为:,3、平均码字长 借助熵的概念可以定义量度任何特定码的性能的准则,即平均码字长度。 其中i为
5、灰度级di所对应的码字长度。的单位也是比特/字符。,4、编码效率 编码符号是在字母集合A=a1,a2,a3,am中选取的。如果编码后形成一个新的等概率的无记忆信源,字母数为n,则它的最大熵应为logn比特/符号。因此这是一个极限值。如果H(d)/ =logn,则可以认为编码效率已经达到100%,如果H(d)/ logn,则可认为编码效率较低。,5、压缩比 压缩比是衡量数据压缩程度的指标之一。目前常用的压缩比定义为 其中LB为源代码长度,Ld为压缩后代码长度,Pr为压缩比。 压缩比的物理意义是被压缩掉的数据占据源数据的百分比。当压缩比Pr接近100%时压缩效果最理想。,6、互信息 信源编码输出为
6、bk给出的关于ai的信息量究竟为多少呢?为此将引入另外一个信息量度互信息 对给定的两个离散信源X和Y,Y中事件bk的发生给出关于X中事件ai的互信息I(ai:bk)定义为: 其中,p(ai|bk)表示信源编码输出为bk,估计信源输入为ai的条件概率。I(ai|bk)称为条件自信息量,表示在发现信源编码输出为bk,对信源输入为ai的不确定性的猜测或知道bk后ai还保留的信息量。I(ai)表示ai的不确定性。两者值差即为bk解除的ai不确定性的多少。,无损压缩编码,哈夫曼编码 游程编码 无损预测编码,哈夫曼编码,50年代提出,一种无损的统计编码方法 用变长的码使冗余量达到最小,用一棵二叉树来编码,
7、使常出现的字符用较短的码表示,不常出现的字符用较长的码表示。,用一个例子来介绍哈夫曼编码的步骤,1、缩减信源符合数量将概率从大到小排列,再将两个概率最小的符号结合得到1个组合符号,如果剩下的符号多余2个,继续上述过程,直到只剩2个符号为止。,给出一组初始信源的概率分布,1,2,3,4,2、对每个信源赋值先从(消减到)最小的信源开始,逐步回到初始信源,过程如表所示。对一个只有2个符号的信源,最短长度的二元码由符号0和1组成,将它们赋予对应最右列2个概率的符号,1,2,3,4,哈夫曼编码效率,信源熵为: H=-Pilog2Pi =-(0.4log20.4+0.3log20.3 +2*0.1log2
8、0.1+0.06log20.06+0.04log20.04) =2.14比特/符号,平均码字长度:R=iPi,码字长度,R= iPi =0.41+0.3 2+0.1 3+0.1 4+0.06 5+0.04 5=2.2比特/符号,编码效率:=H/R(%) =H/R=2.14/2.2=0.973=97.3%,游程编码RLC,根据对各类图像的统计,发现图像信源中象素的空间相关性比较强。在经过采用和量化形成数字彩色图像后,其相邻象素的相关性体现在相邻象素亮度取值变化不大,对典型的黑白文本图像进行分析发现,前一象素为白色象素时,当前象素取值为白的条件概率P(W|W)平均在97%以上,而由白象素变为黑象素
9、的概率P(B|W)仅为3%,类似的,当前一象素为黑,当前象素为黑的条件概率P(B|B)平均为75%,由黑变白的概率P(W|B)仅为25%。,对重复出现的字符、字符连续重复的个数以及起始位置进行编码,就能恢复该字符串,基本RLC结构,从RLC基本数据占用3个字节,即只有当重复字符串长度大于24(即连续有24个象素取值相同)时,才有数据压缩效益。,先判断游程长度,再决定是否使用RLC,从根本上讲,游程编码依然是通过去除图像象素间的相关性,来达到数据压缩的目的,但是它不仅仅只利用一个相邻象素的信息,实际上,利用了图像多个象素间的相关性,其熵为高阶熵,数字传真压缩编码标准,二值文本图像,无损预测编码,
10、预测编码有线性预测和非线性预测两大类,可以在一幅图像内进行,即所谓的帧内预测法,也可以在多幅图像之间进行,即所谓的帧间预测法。 线性预测法通常称为差值脉冲编码调制法(Differential Pulse Code Modulation),简称DPCM,相邻像素间的空域相关性,相邻帧之间的时域相关性,预测编码的基本思想:通过仅提取每个象素中的新信息并对它们编码,来消除象素间的冗余,该象素的当前或现实值与预测值的差,预测误差:en=fn-fn,差组成,预测误差序列,预测误差的熵为信源的高阶熵,通过预测可以消除相当多的象素间冗余,所以预测误差的概率密度函数一般在0点有1个高峰,并且与输入灰度值分布相
11、比,其方差较小,事实上,预测误差的概率密度函数一般用0均值不相关拉普拉斯概率密度函数表示,pe(e) =,有损压缩,有损预测编码 变换编码,有损预测编码,在无损预测编码系统基础上,加1个量化器构成,如图所示,量化器插在符号编码器与预测误差产生处之间,把原来无损编码器中的整数舍入模块吸引进来,它将预测误差映射进有限个输出e.n中,e.n确定了有损预测编码中的压缩量和失真量,为接纳量化步骤,需要改变无损编码器,以使编码器和解码器所产生的预测能相等,从上图可以看出,将有损编码器的预测器放在1个反馈环中,这个环的输入是过去预测和与其相对应的量化误差的函数: f.n=e.n+fn,这样一个闭环结构,其目
12、的是能防止在解码器的输出端产生误差,德尔塔调制(DM)是1中最简单的有损预测编码方法,其预测器和量化器分别定义为:,其中a是预测系数(一般小于等于1),c是1个正的常数,因为量化器的输出可用单个位符表示(输出只有2个值),所以上图编码器中的符号编码器只用长度固定为1bit的码,由DM方法得到的码率是1比特/象素,DM编码示例,取上述公式中的a=1和c=6.5。设输入序列为14,15,14,15,13,15,15,14,20,26,27,28,27,27,29,37,47,62,75,77,78,79,80,81,82,82。编码开始时,先将第一个输入象素直接传给编码器。在编码器和解码器两端都建
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 图像 压缩
链接地址:https://www.31doc.com/p-2607419.html