【计算机视觉】数字图像处理(六)—— 图像压缩

这篇具有很好参考价值的文章主要介绍了【计算机视觉】数字图像处理(六)—— 图像压缩。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

一、图像压缩概述

(一)、图像编码技术的研究背景

1. 信息信息传输方式发生了很大的改变
  1. 通信方式的改变

文字+语音 图像+文字+语音

  1. 通信对象的改变

人与人 人与机器,机器与机器

2. 图像传输与存储需要的信息量空间
(1)彩色视频信息

对于电视画面的分辨率640480的彩色图像,每秒30帧,则一秒钟的数据量为:
640
4802430=210.94M – 所以播放时,需要211Mbps的通信回路。
– 参考数据:宽带网为2048K。
– 存储时,1张DVD可存4.7G,则仅可以存放22.8秒的数据。

(2)传真数据

–如果只传送2值图像,以200dpi的分辨率传输,一张A4稿纸的内容的数据量为:
165423371=3888768bit –按64K的电话线传输速率,需要传送的时间是:59.3秒(目前四类传真机15s内传送一
页 ISO A4幅面文件

由于通信方式和通信对象的改变带来的最大问题是:
–传输带宽、速度、存储器容量的限制。
• 给我们带来的一个难题,也给了我们一个机会:

如何用软件的手段来解决硬件上的物理极限

3.图像通信系统模型

【计算机视觉】数字图像处理(六)—— 图像压缩

4.图像冗余无损压缩的原理

【计算机视觉】数字图像处理(六)—— 图像压缩

从原来的1638=284bits 压缩为:(1+3)*8=32bits

【计算机视觉】数字图像处理(六)—— 图像压缩

(二)、 图像压缩与压缩的必要性

  1. 图像压缩

• 图像压缩,本质上说,就是对图像源数据按一定的规则进行变换和组合,从而达到以尽可能少的代码来表示尽可能多的数据信息。压缩通过编码来实现,或者说编码带来压缩的效果,所以,一般把此项处理称之为压缩编码。

  1. 压缩的必要性
    • 一幅模拟图像必须经过脉冲编码调制(PCM—Pulse Code Modulation)才能变成数字图像。

(PCM-脉码调制早期用于语音信号传送)

二、图像压缩的保真度准则与压缩性能参数

三、统计编码压缩

(一)、 统计编码概述

– 根据图像像素灰度值出现的概率的分布特性而进行的压缩编码叫统计编码。

– 熵与平均码字长度
• 1)H(d) < R(d)时,一定可以设计出某种平均码字长更短的无失真编码方法。
• 2)平均码字长小于H(d)的无失真编码方法不存在。

– 熵编码
• 使编码后的图像的平均码字长度尽可能接近图像的熵H。
• 基本思路是:概率大的灰度级用短码字,概率小的,用
长码字

(二)、 统计编码方法

1. 行程编码(RLE编码)

• (1)基本原理

– 通过改变图像的描述方式,来实现压缩。将一行中颜
色值相同的相邻像素用一个计数值和该颜色值来代替。

• (2)举例说明

aaaabbbccdeeeeefffffff (共22*8=176 bits)

4a3b2c1d5e7f (共12*8=96 bits)

• (3)应用分析
– 适合行程较长的图像,一般不单独使用。

2. Huffman 编码(熵编码)

–基本原理:
• 为了达到更大的压缩率,提出了一种方法,就是将在图像中出现频率大的像素值给一个比较短的编码,将出现频率小的像数值给一个比较长的编码。

【计算机视觉】数字图像处理(六)—— 图像压缩

哈夫曼详解|:

3. Shannon-Fano编码

算法:
• 1)将灰度级概率按非递增排序;
• 2)按概率之和相近或相等原则将灰度级集一分为二;
• 3)将以上分割准则递归地应用到灰度级子集,直至最终子集只有一个灰度级为止;
• 4)在分割过程中,分别给所分得的两个子集赋予0和1

【计算机视觉】数字图像处理(六)—— 图像压缩

平均码长:

【计算机视觉】数字图像处理(六)—— 图像压缩

信息熵:

【计算机视觉】数字图像处理(六)—— 图像压缩

编码效率:

【计算机视觉】数字图像处理(六)—— 图像压缩

四、预测编码与变换编码压缩

(一)、预测编码

– 预测编码(Predictive Coding),是根据“过去”的时刻的像素值,运用一种模型,预测当前的像素值,预测编码通常不直接对信号编码,而是对预测误差进行编码。当预测比较准确,误差较小时,即可达到编码压缩的目的。

– 原理:对图像的一个像素的离散幅度的真实值,利用其相邻像素的相关性,预测它的下一个像素的可能值,再求两者差,对这种具有预测性质的差值,量化,编码,就可以达到压缩的目的。

预测编码示意图

【计算机视觉】数字图像处理(六)—— 图像压缩

预测器:

f ^ n = F ( f n − 1 , f n − 2 , . . . , f n − k ) \widehat{f}_n = F(f_{n-1}, f_{n-2}, ... , f_{n-k}) f n=F(fn1,fn2,...,fnk)

f ^ n \widehat{f}_n f n 是根据前面几个像素的亮度值 f n − 1 , f n − 2 , . . . , f n − k f_{n-1}, f_{n-2}, ... , f_{n-k} fn1,fn2,...,fnk

预测而得: Δ n = f n − f ^ n \Delta{}_n = f_n - \widehat{f}_n Δn=fnf n

量化器:对 Δ n \Delta{}_n Δn 进行舍入,整量化

编码器:可采用成熟的编码技术,如Huffman编码等

解码器:编码器的逆

【计算机视觉】数字图像处理(六)—— 图像压缩

【计算机视觉】数字图像处理(六)—— 图像压缩

在预测编码中,最常用的是差分脉码调制(Differential Pulse Code Modulation, DPCM),

原理图如下所示:

【计算机视觉】数字图像处理(六)—— 图像压缩
收端解码时的预测过程与发端相同,所用预测
器也相同,收端输出的信号是发端的近似值,
两者的误差是

【计算机视觉】数字图像处理(六)—— 图像压缩
注意:1)多点预测;

【计算机视觉】数字图像处理(六)—— 图像压缩

【计算机视觉】数字图像处理(六)—— 图像压缩

每行的最开始的几个像素无法预测,这些像素需要用其他方式编码,这是采用预测编码所需要的额外操作

预测系数随着不同的图像而不同,但对每幅图像都计算预测系数太麻烦,也不现实,可参考前人得到的数据选择使用。在静止图像压缩的国际标准(JPEG)中,对这种方法的前置点形式以及预测系数有一推荐值可供参考。

(二)、 变换编码

原理:图像数据经过正交变换后,其变换系数具有一定的相互独立性,(例如,对于FT来说,频普系数大的变换系数均集中在低频部分,而高频部分的幅值均很小,因而可以对低频的变换系数量化、编码和传输,对高频部分不处理,这样可以达到图像压缩的目的。

变换编码的一般系统框图

【计算机视觉】数字图像处理(六)—— 图像压缩

五、图像编码与压缩标准

(一)、 图像编码标准:

– JBIG,H.26x,JPEG,MPEG等

(二)、 静止图像格式-JPEG

• 国际标准化组织(ID)和国际电报电话咨询委员会(CCITT)联合成立的专家组JPEG(Joint Photographic Experts Group)于1991年3月提出了ISO CDIO918号建议草案:多灰度静止图像的数字压缩编码(通常简称为JPEG标准)。

这是一个适用于彩色和单色多灰度或连续色调静止数字图像的压缩标准。它包括基于DPCM(差分脉冲编码调制)、DCT(离散余弦变换)和Huffman编码的有损压缩算法两个部分。

JPEG压缩编码算法的主要计算步骤如下:
  1. 正向离散余弦变换(FDCT);
  2. 量化(quantization);
  3. Z字形编码(zigzag scan);
  4. 使用差分脉冲编码调制(differential pulse code modulation,DPCM)对直流 系数(DC)进行编码;
  5. 使用行程长度编码(run-length encoding,RLE) 对交流系数(AC)进行编码。
  6. 熵编码(entropy coding)。
JPEG压缩编码算法

【计算机视觉】数字图像处理(六)—— 图像压缩

(三)、 活动图像格式-MPEG

MPEG(Moving Pictures Experts Group)是 ISO/IEC/JTC/SC2/WG11的一个小组。它的工作兼顾了JPEG标准和CCITT专家组的H.261标准,于1990年形成了一个标准草案。

• MPEG标准分成两个阶段:第一个阶段(MPEG1)是针对传输速率为 lMb/s到l.5Mb/s的普通电视质量的视频信号的压缩;
第二个阶段(MPEG-2)目标则是对每秒30帧的720x572
分辨率的视频信号进行压缩;在扩展模式下,MPEG-2可以对分辨率达1440Xl152高清晰度电视(HDTV)的信号进行压缩

MPEG-3:原本针对于HDTV(1920×1080),后来被MPEG-2代替。

• ·MPEG-4:针对多媒体应用的图像编码标准。是为了播放流式媒体的高质量视频而专门设计的,它可利用很窄的带度,通过帧重建技术,压缩和传输数据,以求使用最少的数据获得最佳的图像质量。

• ·MPEG-7:基于内容表示的标准,应用于多
媒体信息的搜索,过滤,组织和处理文章来源地址https://www.toymoban.com/news/detail-447142.html

小结

  • 图像编码的必要性: 编码目的及原理
  • 图像编码的分类: 统计编码、预测编码、变换编码等。
  • 图像编码中的保真度准则: 客观(均方差、均方信噪 比);主观。
  • 编码的性能参数:熵、平均码长、冗余度、编码效率。
  • 统计编码:行程编码、霍夫曼编码
  • 预测编码、变换编码
  • 图像编码的国际标准:JPEG、MPEG

到了这里,关于【计算机视觉】数字图像处理(六)—— 图像压缩的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 计算机视觉(2)——图像预处理

    二、图像预处理 2.1 介绍  2.2 特征提取方法 2.2.1 直方图 2.2.2 CLAHE 2.2.3 形态学运算 2.2.4 空间域处理及其变换 2.2.5 空间域分析及变换  (1) 均值滤波 (2)中值滤波 (3)高斯滤波 (4) 梯度Prewitt滤波 (5) 梯度Sobel滤波 (6) 梯度Laplacian滤波 (7) 其他滤波  2.2.6 频域分

    2024年02月03日
    浏览(63)
  • 图像处理/计算机视觉期刊投稿经验

    我不配,以后有机会再说吧。 我也不配,以后有机会再说吧。 2022年投过,一个月之后被编辑immediate reject, 原因是“the scope not aligning well with the theme interest and/or desired genres of TSP”。在邮件的末尾,编辑表示manuscript的选题“well motivated”并且“interesting”,主要担忧是所用到的

    2024年02月08日
    浏览(55)
  • 计算机视觉图像处理常用方法汇总

    光线进入眼睛:当光线从一个物体反射或散射出来,进入人的眼睛时,它们通过角膜和晶状体进入眼球内部。 聚焦光线:角膜和晶状体将光线聚焦在视网膜上。晶状体可以通过调整其形状来调节聚焦距离,使物体的图像清晰地映射在视网膜上。 光敏细胞感受光线:视网膜是

    2024年02月07日
    浏览(55)
  • 机器视觉、图像处理和计算机视觉:概念和区别

    机器视觉、图像处理和计算机视觉:概念和区别nbsp; 机器视觉、图像处理和计算机视觉是相关但有区别的概念。 机器视觉主要应用于工业领域,涉及图像感知、图像处理、控制理论和软硬件的结合,旨在实现高效的运动控制或实时操作。 图像处理是指利用计算机对图像进行

    2024年02月06日
    浏览(47)
  • 计算机视觉实验:图像处理综合-路沿检测

    目录 实验步骤与过程 1. 路沿检测方法设计 2. 路沿检测方法实现 2.1 视频图像提取 2.2 图像预处理 2.3 兴趣区域提取 2.4 边缘检测 ​​​​​​​2.5 Hough变换 ​​​​​​​2.6 线条过滤与图像输出 3. 路沿检测结果展示 4. 其他路沿检测方法 实验结论或体会 实验内容: 针对

    2024年02月14日
    浏览(49)
  • 【计算机视觉】【图像处理综合应用】路沿检测

    实验内容: 针对给定的视频,利用图像处理基本方法实现道路路沿的检测; 提示:可利用 Hough 变换进行线检测,融合路沿的结构信息实现路沿边界定位(图中红色的点位置)。 处理视频文件 处理视频文件的主要流程如下: 读取视频 → 逐帧提取 → 路沿检测 → 逐帧保存

    2024年02月05日
    浏览(58)
  • 图像处理与计算机视觉--第五章-图像分割-Canny算子

    2.1.Canny算子简单介绍 Canny算子是一种非常常用的边缘检测算子,其效果图如下所示: 2.2.Canny算子边缘检测指标 Canny算子是基于边缘检测来实现的,那么边缘检测的指标如下所示: (1)好的信噪比,即将非边缘点判定为边缘点的概率要低。 (2)高定位,检测出的边缘要在实际边缘中

    2024年02月07日
    浏览(56)
  • 利用C++进行图像处理与计算机视觉

    在C++中进行图像处理与计算机视觉是一个有趣且具有挑战性的任务。C++是一种高效的编程语言,能够提供足够的灵活性和性能,以处理复杂的图像处理和计算机视觉算法。在本文中,我们将介绍如何使用C++进行图像处理和计算机视觉,以及一些常见的技术和库。 图像处理基础

    2024年01月16日
    浏览(50)
  • 【OpenCV】计算机视觉图像处理基础知识

    目录 前言 推荐 1、OpenCV礼帽操作和黑帽操作 2、Sobel算子理论基础及实际操作 3、Scharr算子简介及相关操作 4、Sobel算子和Scharr算子的比较 5、laplacian算子简介及相关操作 6、Canny边缘检测的原理 6.1 去噪 6.2 梯度运算 6.3 非极大值抑制 6.4 滞后阈值 7、Canny边缘检测的函数及使用

    2024年02月05日
    浏览(57)
  • 图像处理与计算机视觉--第五章-图像分割-自适应阈值分割

      在图片处理过程中,针对铺前进行二值化等操作的时候,我们希望能够将图片相应区域内所有的信息提供保留。实验室环境下,相应的素材是模板化的,但是将实验室方法应用于现实环境中时,我们会发现光影环境对于效果的影响其实是很大的。在这种情况下进行处理,

    2024年02月07日
    浏览(56)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包