读数据压缩入门笔记09_多媒体数据压缩

这篇具有很好参考价值的文章主要介绍了读数据压缩入门笔记09_多媒体数据压缩。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

读数据压缩入门笔记09_多媒体数据压缩文章来源地址https://www.toymoban.com/news/detail-596406.html

1. 压缩分类

1.1. 多媒体数据压缩(media-specific compression)

1.2. 通用压缩(general purpose compression)

2. 有损压缩算法

2.1. 为了使数据压缩得更小,可以牺牲多媒体的质量这样的数据转换

2.2. 针对特定的多媒体文件

2.2.1. 针对图像文件的算法就不太适用于音频文件

2.3. 针对内容类型

2.3.1. 灰度图像与全彩图像使用的压缩算法不同

2.4. 有损压缩工具通常会被首先应用,以减少数据的动态变化范围,从而为进一步的无损压缩做准备

2.5. 有损压缩工具其实有无限多种,选择哪一种取决于需要处理的数据类型、你的需求以及用户愿意容忍多大范围的失真

3. 一图胜千言

3.1. 图像是通过二维网格中的像素来显示的,这些像素表示的是图像本身的颜色

3.2. 一张1024×1024的RGB色彩模式的图片,其大小就有3 MB

3.3. 用ASCII码来表示字母的话,同样的空间能用来表示3145728个字母

3.4. 《霍比特人》一书只有95022个单词

3.4.1. 假定平均每个单词由5个字母组成,那么这本书大约有475 110个字母

3.5. 一张1024×1024的图片所占用的空间,可以用来存放约6本《霍比特人》这样篇幅的书

3.6. 当你考虑减少应用程序的数据所占用的空间时,图像应该是你最先关注的

3.6.1. 这是最容易实现的目标,而且常常是小的改变就能带来大的收获

4. 图像质量与文件大小

4.1. 图像压缩工具会提供一个整数参数,让你来决定图像的质量

4.2. 对于级别在75~100的JPG压缩,通常用户只能感受到很小的质量差别

4.3. 当质量值为75时对普通用户来说很多图片看着挺好,但是其文件大小只有质量值为95时的一半

4.4. 当质量值低于75时,图片看起来就变差很多,并且节省的空间也在逐渐递减

4.5. 导致图像压缩出现视觉问题的最常见的两种形式

4.5.1. 量化(quantization)

4.5.2. 区块化(blocking)

4.6. 评价图像数据指标

4.6.1. 峰值信噪比(peak signal-to-noise ratio,PSNR)

4.6.1.1. 表示一个信号的最大可能功率与影响它的表示精度的破坏性噪声功率的比值(以对数分贝为单位)

4.6.1.2. 这一度量的基础是压缩图片的均方误差(mean-square error,MSE)

4.6.1.2.1. PSNR与MSE之间,存在着反比关系

4.6.1.3. 原始图像的值与压缩后的值差别有多大

4.6.2. 结构相似性(structural similarity index,SSIM)

4.6.2.1. 在比较图像的压缩质量时考虑了人眼的感知情况

4.6.2.2. 通过比较源图像与压缩后图像的边缘相似性来实现的

5. 图像的尺寸

5.1. 将全分辨率的图像发送到设备上,在渲染前再调整大小,对开发人员来说,这样做肯定最省事

5.2. 缺点也很明显,我们将用户不需要(也不会看)的数据发给了他们

5.3. 发送合适大小的图像给用户

5.3.1. 发送的数据量更少了,这会更快,也会节省用户的套餐费用

5.3.2. 可以节省用户的设备空间

5.3.3. 无须再调整图像的大小

5.3.4. 解码会更快,加载会更快,显示也会更快

5.3.5. 向小屏幕发送小尺寸的图像

6. 正确的图像格式

6.1. PNG

6.1.1. 1995年由7名工程师组成,开发了PNG这种全新的、无专利权的数据格式

6.1.2. 便携式网络图像格式(Portable Network Graphics format,PNG)

6.1.3. 无损图像格式

6.1.4. 使用GZIP这样的压缩工具使数据量变小

6.1.5. 在图像保存为PNG格式之前,进行一些有损的预处理,来提高图像的压缩率

6.1.6. 你想压缩的是颜色比较少的图像,比如手绘的卡通画,那么PNG对应的无损压缩工具表现得会更好

6.2. JPG

6.2.1. 用于摄影图像的格式

6.2.2. 不支持alpha透明度

6.2.3. 分块过程只对摄影图像(即照片)适用

6.2.4. 大多数移动设备现在有系统可用的JPG编码和解码的硬件

6.2.4.1. 解码一个JPG文件需要的时间要比解码同样大小的PNG文件短很多

6.3. GIF

6.3.1. 第一步是有损的色彩数量压缩,将整个图像的颜色数量减少到只有256种

6.3.2. 第二步则是无损的LZW压缩

6.4. WebP

6.4.1. 2013年,谷歌和其他开源贡献者开发了一种新的图像编解码算法

6.4.2. 介于PNG和JPG之间的中间地带

6.4.3. 既支持无损模式和透明度,同时也支持有损模式

6.4.4. 在有损压缩模式下的高压缩率,也就意味着在解压时它要比JPG或者PNG格式慢一些

6.4.5. 即使某个算法在技术上是先进的,它还是会受到与此相关的同类技术产品偏见的影响,同时它也必须获得具有普遍怀疑精神的工程师的承认和认同

6.4.5.1. Mozilla的抵制

7. GPU纹理格式

7.1. 计算机不能直接利用压缩格式的数据绘制图像,而是需要先将压缩的数据加载到内存中,然后再解压为系统可以直接渲染的格式

7.2. 图像会被当作纹理传输到GPU中

7.2.1. 生成的每一个位图都会同时需要CPU和GPU内存

7.3. GPU能直接渲染的像素压缩格式是存在的

7.3.1. DXT、ETC和PVR就是几种这样的有损像素压缩格式

8. 光栅格式图像

8.1. raster format image

8.2. 当从远处观察图像时,像素之间的边缘就会消失,这样人的眼睛(被欺骗了)看到的就是平滑的颜色渐变。这种类型的图像通常被称为光栅格式图像

8.3. 可以(比较直接地)在屏幕上渲染

8.4. 光栅格式则适用于相片以及其他信息密集的图像

9. 矢量格式

9.1. SVG是一种常用的矢量图像格式

9.1.1. 无论源数据多大,有了它,我们就能用很少的内存来描述图像,并在客户端生成高质量的与分辨率无关的图像

9.2. 矢量格式适用于标志、技术图纸以及简单的图像样式

到了这里,关于读数据压缩入门笔记09_多媒体数据压缩的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【软考程序员学习笔记】——多媒体基础知识

    目录 🍊 一、多媒体的概念及分类 多媒体的分类 🍊二、声音信号的数字化过程 采样 量化 编码 🍊三、常见音频文件格式 🍊四、图形/图像区别  图形 图像 🍊五、常见图像文件格式 🍊六、常见视频文件格式 🍊七、显示器的基本参数 传播信息的载体,如语言、文字、图

    2024年02月09日
    浏览(49)
  • SDL库入门:掌握跨平台游戏开发和多媒体编程

    SDL (Simple DirectMedia Layer) 是一个跨平台的开源多媒体库,它提供了访问音频、键盘、鼠标、操纵杆以及图形硬件的底层接口。SDL 可用于开发游戏、仿真器、媒体播放器等多种类型的应用程序。 1.1 SDL 的背景与应用领域 SDL 由 Sam Lantinga 开发,最早发布于 1998 年。SDL 的设计目标是

    2024年02月02日
    浏览(46)
  • [前端笔记——多媒体与嵌入] 6.HTML 中的图片+视频+音频内容

    可以用 img 元素来把图片放到网页上。它是一个空元素(它不需要包含文本内容或闭合标签),最少只需要一个 src (一般读作其全称 * *source) * *来使其生效。src 属性包含了指向我们想要引入的图片的路径,可以是相对路径或绝对 URL,就像 a 元素的 href 属性一样。 属性是

    2023年04月25日
    浏览(57)
  • 多媒体数据处理实验2:PCA

    1. 算法描述 功能:  利用PCA算法可以对给定的数据集进行降维操作,使得处理后的数据不仅维数较低、能保存绝大部分信息,而且各维之间的相关性也为0(没有冗余信息,正交)。 2. PCA的数学原理 (1) PCA的目的   一般而言,一个未经处理的数据集可能存在两个问题,一个

    2023年04月24日
    浏览(88)
  • 多媒体数据处理实验3:图像特征提取与检索

    1. 算法描述 功能:   使用BOF(Bag of Features)算法提取图像特征,在corel数据集(10*100)张图片上实现以图搜图,即输入数据集中某一张图,在剩下的999张图里搜索最邻近的10张图。 2.算法流程: 用 SIFT算法 提取图像的特征。每幅图像提取出几百至几千个特征点,将所有图像的特

    2024年02月07日
    浏览(67)
  • 智能存储:多媒体实验室AIGC能力助力数据万象开启智能剪辑大门

    AIGC正从效率、质量、创意、多样性各方面革新内容生产流程,伴随firely、midjourney等现象级的产品出现,AIGC将逐步 广泛服务于内容生产的各类场景与内容生产者,随着AIGC在内容生产的需求场景不断增加,多媒体实验室也在AIGC领域持续发力,并通过数据万象将 能力成功应用到

    2024年02月10日
    浏览(50)
  • 软考:中级软件设计师:多媒体基础,音频,图像,颜色,多媒体技术的种类,图像音频视频的容量计算,常见的多媒体标准

    提示:系列被面试官问的问题,我自己当时不会,所以下来自己复盘一下,认真学习和总结,以应对未来更多的可能性 关于互联网大厂的笔试面试,都是需要细心准备的 (1)自己的科研经历, 科研内容 ,学习的相关领域知识,要熟悉熟透了 (2)自己的实习经历,做了 什

    2024年02月09日
    浏览(57)
  • 「专题速递」数据驱动赋能、赛事直播优化、RTC技术、低延时传输引擎、多媒体处理框架、GPU加速...

    点击文末阅读原文, 免费报名【抖音背后的体验增长实战揭秘】专场 随着全行业视频化的演进,营销、知识、商业和空间的交互体验正在被重塑。这种变化不仅仅是一种抽象的趋势,更是关系到用户留存和业务增长的关键因素。面对这样的挑战,一个关键的问题摆在我们面

    2024年02月06日
    浏览(49)
  • 参会记录|全国多媒体取证暨第二届多媒体智能安全学术研讨会(MAS‘2023)

    前言 :2023年4月8日上午,我与实验室的诸位伙伴们共聚浙江杭州西子湖畔的六通宾馆,参加了为期一天半的全国多媒体取证暨第二届多媒体智能安全学术研讨会(MAS’2023)。本届学术研讨会由浙江省自然科学基金委员会资助,杭州电子科技大学承办。来自国内多媒体取证与

    2024年02月08日
    浏览(57)
  • 多媒体音频焦点浅析

    多个音源可以同时向同一个输出流进行播放音频,如果没有音频焦点管控,就会出现多个音源同时播放的现象,给用户带来不便;而Android为了避免多个音源同时播放,就引入了音频焦点的概念,所有音频应用都统一按照音频焦点的规定执行,就可以避免该现象发生。 当应用

    2024年02月13日
    浏览(47)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包