一、图像压缩概述
(一)、图像编码技术的研究背景
1. 信息信息传输方式发生了很大的改变
- 通信方式的改变
文字+语音 图像+文字+语音
- 通信对象的改变
人与人 人与机器,机器与机器
2. 图像传输与存储需要的信息量空间
(1)彩色视频信息
对于电视画面的分辨率640480的彩色图像,每秒30帧,则一秒钟的数据量为:
6404802430=210.94M – 所以播放时,需要211Mbps的通信回路。
– 参考数据:宽带网为2048K。
– 存储时,1张DVD可存4.7G,则仅可以存放22.8秒的数据。
(2)传真数据
–如果只传送2值图像,以200dpi的分辨率传输,一张A4稿纸的内容的数据量为:
165423371=3888768bit –按64K的电话线传输速率,需要传送的时间是:59.3秒(目前四类传真机15s内传送一
页 ISO A4幅面文件
由于通信方式和通信对象的改变带来的最大问题是:
–传输带宽、速度、存储器容量的限制。
• 给我们带来的一个难题,也给了我们一个机会:
如何用软件的手段来解决硬件上的物理极限
3.图像通信系统模型
4.图像冗余无损压缩的原理
从原来的1638=284bits 压缩为:(1+3)*8=32bits
(二)、 图像压缩与压缩的必要性
- 图像压缩
• 图像压缩,本质上说,就是对图像源数据按一定的规则进行变换和组合,从而达到以尽可能少的代码来表示尽可能多的数据信息。压缩通过编码来实现,或者说编码带来压缩的效果,所以,一般把此项处理称之为压缩编码。
- 压缩的必要性
• 一幅模拟图像必须经过脉冲编码调制(PCM—Pulse Code Modulation)才能变成数字图像。
(PCM-脉码调制早期用于语音信号传送)
二、图像压缩的保真度准则与压缩性能参数
三、统计编码压缩
(一)、 统计编码概述
– 根据图像像素灰度值出现的概率的分布特性而进行的压缩编码叫统计编码。
– 熵与平均码字长度
• 1)H(d) < R(d)时,一定可以设计出某种平均码字长更短的无失真编码方法。
• 2)平均码字长小于H(d)的无失真编码方法不存在。
– 熵编码
• 使编码后的图像的平均码字长度尽可能接近图像的熵H。
• 基本思路是:概率大的灰度级用短码字,概率小的,用
长码字
(二)、 统计编码方法
1. 行程编码(RLE编码)
• (1)基本原理
– 通过改变图像的描述方式,来实现压缩。将一行中颜
色值相同的相邻像素用一个计数值和该颜色值来代替。
• (2)举例说明
aaaabbbccdeeeeefffffff (共22*8=176 bits)
4a3b2c1d5e7f (共12*8=96 bits)
• (3)应用分析
– 适合行程较长的图像,一般不单独使用。
2. Huffman 编码(熵编码)
–基本原理:
• 为了达到更大的压缩率,提出了一种方法,就是将在图像中出现频率大的像素值给一个比较短的编码,将出现频率小的像数值给一个比较长的编码。
哈夫曼详解|:
3. Shannon-Fano编码
算法:
• 1)将灰度级概率按非递增排序;
• 2)按概率之和相近或相等原则将灰度级集一分为二;
• 3)将以上分割准则递归地应用到灰度级子集,直至最终子集只有一个灰度级为止;
• 4)在分割过程中,分别给所分得的两个子集赋予0和1
平均码长:
信息熵:
编码效率:
四、预测编码与变换编码压缩
(一)、预测编码
– 预测编码(Predictive Coding),是根据“过去”的时刻的像素值,运用一种模型,预测当前的像素值,预测编码通常不直接对信号编码,而是对预测误差进行编码。当预测比较准确,误差较小时,即可达到编码压缩的目的。
– 原理:对图像的一个像素的离散幅度的真实值,利用其相邻像素的相关性,预测它的下一个像素的可能值,再求两者差,对这种具有预测性质的差值,量化,编码,就可以达到压缩的目的。
预测编码示意图
预测器:
f ^ n = F ( f n − 1 , f n − 2 , . . . , f n − k ) \widehat{f}_n = F(f_{n-1}, f_{n-2}, ... , f_{n-k}) f n=F(fn−1,fn−2,...,fn−k)
f ^ n \widehat{f}_n f n 是根据前面几个像素的亮度值 f n − 1 , f n − 2 , . . . , f n − k f_{n-1}, f_{n-2}, ... , f_{n-k} fn−1,fn−2,...,fn−k
预测而得: Δ n = f n − f ^ n \Delta{}_n = f_n - \widehat{f}_n Δn=fn−f n
量化器:对 Δ n \Delta{}_n Δn 进行舍入,整量化
编码器:可采用成熟的编码技术,如Huffman编码等
解码器:编码器的逆
在预测编码中,最常用的是差分脉码调制(Differential Pulse Code Modulation, DPCM),
原理图如下所示:
收端解码时的预测过程与发端相同,所用预测
器也相同,收端输出的信号是发端的近似值,
两者的误差是
注意:1)多点预测;
每行的最开始的几个像素无法预测,这些像素需要用其他方式编码,这是采用预测编码所需要的额外操作
预测系数随着不同的图像而不同,但对每幅图像都计算预测系数太麻烦,也不现实,可参考前人得到的数据选择使用。在静止图像压缩的国际标准(JPEG)中,对这种方法的前置点形式以及预测系数有一推荐值可供参考。
(二)、 变换编码
原理:图像数据经过正交变换后,其变换系数具有一定的相互独立性,(例如,对于FT来说,频普系数大的变换系数均集中在低频部分,而高频部分的幅值均很小,因而可以对低频的变换系数量化、编码和传输,对高频部分不处理,这样可以达到图像压缩的目的。
变换编码的一般系统框图五、图像编码与压缩标准
(一)、 图像编码标准:
– JBIG,H.26x,JPEG,MPEG等
(二)、 静止图像格式-JPEG
• 国际标准化组织(ID)和国际电报电话咨询委员会(CCITT)联合成立的专家组JPEG(Joint Photographic Experts Group)于1991年3月提出了ISO CDIO918号建议草案:多灰度静止图像的数字压缩编码(通常简称为JPEG标准)。
这是一个适用于彩色和单色多灰度或连续色调静止数字图像的压缩标准。它包括基于DPCM(差分脉冲编码调制)、DCT(离散余弦变换)和Huffman编码的有损压缩算法两个部分。
JPEG压缩编码算法的主要计算步骤如下:
- 正向离散余弦变换(FDCT);
- 量化(quantization);
- Z字形编码(zigzag scan);
- 使用差分脉冲编码调制(differential pulse code modulation,DPCM)对直流 系数(DC)进行编码;
- 使用行程长度编码(run-length encoding,RLE) 对交流系数(AC)进行编码。
- 熵编码(entropy coding)。
JPEG压缩编码算法
(三)、 活动图像格式-MPEG
MPEG(Moving Pictures Experts Group)是 ISO/IEC/JTC/SC2/WG11的一个小组。它的工作兼顾了JPEG标准和CCITT专家组的H.261标准,于1990年形成了一个标准草案。
• MPEG标准分成两个阶段:第一个阶段(MPEG1)是针对传输速率为 lMb/s到l.5Mb/s的普通电视质量的视频信号的压缩;
第二个阶段(MPEG-2)目标则是对每秒30帧的720x572
分辨率的视频信号进行压缩;在扩展模式下,MPEG-2可以对分辨率达1440Xl152高清晰度电视(HDTV)的信号进行压缩
MPEG-3:原本针对于HDTV(1920×1080),后来被MPEG-2代替。
• ·MPEG-4:针对多媒体应用的图像编码标准。是为了播放流式媒体的高质量视频而专门设计的,它可利用很窄的带度,通过帧重建技术,压缩和传输数据,以求使用最少的数据获得最佳的图像质量。文章来源:https://www.toymoban.com/news/detail-447142.html
• ·MPEG-7:基于内容表示的标准,应用于多
媒体信息的搜索,过滤,组织和处理文章来源地址https://www.toymoban.com/news/detail-447142.html
小结
- 图像编码的必要性: 编码目的及原理
- 图像编码的分类: 统计编码、预测编码、变换编码等。
- 图像编码中的保真度准则: 客观(均方差、均方信噪 比);主观。
- 编码的性能参数:熵、平均码长、冗余度、编码效率。
- 统计编码:行程编码、霍夫曼编码
- 预测编码、变换编码
- 图像编码的国际标准:JPEG、MPEG
到了这里,关于【计算机视觉】数字图像处理(六)—— 图像压缩的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!