计算摄影——图像超分

这篇具有很好参考价值的文章主要介绍了计算摄影——图像超分。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

        这一节主要介绍一下基于单张图的图像超分算法。图像超分,就是要从低分辨率的图像恢复为高分辨率的图像,它在日常的图像和视频存储与浏览中都有广泛的应用。

基于深度学习的图像超分算法

不同的采样结构

        图像超分需要将低分辨率图片恢复为高分辨率图像,因此上采样结构在网络中是必不可少的,因此下面按照上采样结构在不同CNN模型中的位置来区分不同的算法,说明一下其原理和优缺点。

前上采样

        前上采样即在网络的开始完成上采样过程,经典模型为SRCNN模型,其结构如下:

图像超分,计算摄影,计算机视觉,人工智能

SRCNN模型步骤:

  1. 首先使用双线性插值等上采样方法进行初始化,得到目标分辨率大小的图像。
  2. 使用卷积层对输入的局部图像块进行特征提取,得到一系列特征图,即f1
  3. 接着使用1x1卷积进行维度变换,即扩增特征通道数
  4. 最后将高分辨率的图像块重新拼接为完成的图像,即f3

该模型学习过程比较简单,但是由于整个网络在高分辨率空间进行计算,因此计算量大,而且噪声容易被放大。

后上采样

后上采样即在网络的后部分才进行上采样。比较经典的模型结构为FSRCNN和ESPCN。

FSRCNN网络结构如下:

图像超分,计算摄影,计算机视觉,人工智能

想比SRCNN,主要改进在三个地方:

  1. FSRCNN采用原始低分辨率图像作为输入,无需进行双三次插值,在网络末端引入反卷积层来完成上采样,极大的减小了网络参数。
  2. 网将SRCNN中的非线性映射层替换为FSRCNN中的三个层,即收缩、映射和扩展,减少特征参数维度。
  3. 将“宽”的非线性映射层用“**窄”的“深”**的网络来替代。

ESPCN网络结构如下:

图像超分,计算摄影,计算机视觉,人工智能

        该网络的关键亮点在于亚像素卷积层,首先介绍一下亚像素的概念:

        面阵摄像机的成像面以像素为最小单位。在相机成像的过程中,获得的图像数据是将图像进行了离散化处理。例如两个感官元件上的像素之间有4.5um的间距,宏观上它们是连在一起的,微观上它们之间还有无数更小的东西存在,这个更小的东西就称之为“亚像素”。实际上,亚像素应该是存在的,只是缺少更细微的传感器把它检测出来,只能通过软件将起近似计算出来。

        如下图所示,每四个红色点围成的矩形区域为实际原件上的像素点,黑色点为亚像素点:

图像超分,计算摄影,计算机视觉,人工智能

        根据相邻两像素之间插值情况的不同,可以调整亚像素的精度,例如四分之一,就是将每个像素从横向和纵向上当做四个像素点。也就是上面图里的红色点之间有三个黑色点。这样通过亚像素插值的方法可以实现从小矩形到大矩形的映射,从而提高分辨率。

        在原文中,作者将网络模型定义为3层,前两层为普通卷积,最后的亚像素卷积层则包括两个部分,卷积+像素排列。即通过三个卷积层,得到与输入图像尺寸一致、通道数为r2的特征图像,再将特征图像的每个像素的r2个通道重新排列成一个r * r的区域,对应高分辨图像中一个r * r的区域,从而大小为H*W*r2的特征图像重新排列为rH*rW*1的高分辨率图像。

 逐步式上采样

为了解决后采样模型无法对高倍率因子进行很好的超分的问题,逐步式上采样被提出,比较典型的为LapSRN,其网络结构为:

图像超分,计算摄影,计算机视觉,人工智能

        其主要包含两个分支:特征提取分支(即上图中上半部分)和图像重建分支(即图像中下半部分),其中特征提取分支包含多个不同分辨率层级,每一个层级使用多个卷积层来获取非线性特征映射,最后加上反卷积层来提升图像的分辨率;图像重建分支则将输入图进行上采样后和相同分辨率大小的特征提取分支相加来得到下一级分辨率的输出图,直到得到最终的高分辨率结果图。 

优化目标

        早期的基于CNN模型的超分框架如SRCNN,ESPCN都使用图像像素空间的欧式距离(即L2 loss,或者MSE损失)作为优化目标,结果能取得较高的PSNR和SSIM指标,但是存在结果过于平滑的问题。

        人眼对重建结果质量的感知并不完全与这些指标相符,比如MSE指标较小并不能保证局部细节的清晰度,而较大的MSE指标也并不等价于较差的结果,比如原图偏移一个像素后与原图的MSE值可能较大,但是视觉感知效果很接近。

        CNN网络的高层特征空间相比于原始的像素空间,具有较高的抽象层级,它使得原始图像的特征与目标图像的特征差异可以反应在语义级别,这非常符合人眼的主观评估感受,研究者基于此提出了感知损失。基于特征空间计算的欧式距离被称为感知损失(perceptual loss),令φ来表示网络,j表示网络的第j层,表示第j层的特征图的大小,感知损失的定义如下;

图像超分,计算摄影,计算机视觉,人工智能

参考资料:

 【计算摄影】图像超分辨,深度学习核心技术与展望 - 知乎

图像超分算法小合集二:FSRCNN、DRCN、RDN、EDSR_暖风️的博客-CSDN博客_图像超分算法

ESPCN神经网络_uodgnez的博客-CSDN博客_espcn文章来源地址https://www.toymoban.com/news/detail-640119.html

到了这里,关于计算摄影——图像超分的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【计算机视觉 | 图像分割】arxiv 计算机视觉关于图像分割的学术速递(8 月 30 日论文合集)

    Novis:端到端近在线视频实例分割实例 直到最近,视频实例分割(VIS)社区在以下共同信念下操作:离线方法通常优于逐帧在线处理。然而,最近在线方法的成功质疑这种信念,特别是对于具有挑战性和长视频序列。我们将这项工作理解为对最近观察结果的反驳,并呼吁社区

    2024年02月09日
    浏览(42)
  • 【计算机视觉 | 图像分割】arxiv 计算机视觉关于图像分割的学术速递(7 月 6 日论文合集)

    面向跨域语义分割的提示扩散表示法 虽然最初设计用于图像生成,扩散模型最近已证明提供了优秀的预训练的特征表示语义分割。这一结果引起了兴趣,我们开始探索扩散预训练表示如何推广到新的领域,这是任何表示的关键能力。我们发现,扩散预训练实现了非凡的领域泛

    2024年02月12日
    浏览(37)
  • 人工智能在计算机视觉中的应用与挑战

    引言 计算机视觉是人工智能领域的一个重要分支,旨在让计算机能够像人一样理解和解释视觉信息,实现图像和视频的自动识别、理解和分析。计算机视觉技术已经在许多领域产生了深远的影响,如人脸识别、自动驾驶、医学影像分析等。本篇博客将深入探讨人工智能在计算

    2024年02月14日
    浏览(42)
  • 计算机视觉——图像视觉显著性检测

    目录 系列文章目录 零、问题描述 一、图像显著性检测 1.定义 2.难点 二、常用评价标准和计算方法 1.综述 2.ROS曲线详述 2.1 混淆矩阵 2.2 ROC曲线简介 2.3 ROC曲线绘制及其判别标准 2.4 ROC曲线补充 三、Fast and Efficient Saliency (FES) 1.算法简介 2.项目导入与解析 3.FES注意预测实践 4.评价

    2024年02月03日
    浏览(43)
  • 计算机视觉----图像拼接

     一.简介 图像拼接(Image Stitching)是一种利用实景图像组成全景空间的技术,它将多幅图像拼接成一幅大尺度图像或360度全景图,接可以看做是场景重建的一种特殊情况,其中图像仅通过平面单应性进行关联。图像拼接在运动检测和跟踪,增强现实,分辨率增强,视频压缩和图

    2024年02月09日
    浏览(42)
  • 计算机视觉--图像拼接

    单应性变换是指一个平面上的点通过一个矩阵变换映射到另一个平面上的点,这个变换矩阵是一个 3 × 3 3 times 3 3 × 3 的矩阵,称为单应性矩阵。单应性变换可以分为仿射变换和投影变换两种类型。 在单应性变换中,仿射变换是其中一种特殊的变换。仿射变换是指在变换前后

    2024年02月04日
    浏览(39)
  • 计算机视觉 -- 图像分割

    引入问题: 在自动驾驶系统中,如果用之前的检测网络(例如Faster-Rcnn),试想,倘若前方有一处急转弯,系统只在道路上给出一个矩形标识,这样一来车辆很有可能判断不出是该避让还是径直上前,车祸一触即发。因此,对新技术的诉求应运而生,该技术须能识别具体路况

    2024年02月11日
    浏览(34)
  • 计算机视觉的图像标注与视觉任务

           计算机视觉是一种利用计算机和数学算法来模拟人类视觉的技术,可以应用于许多领域。以下是计算机视觉的八大应用:  图像识别:利用计算机视觉技术,可以对图像进行分类、识别和分割,从而实现自动化的图像处理。 视频监控:利用计算机视觉技术,可以对视

    2024年02月16日
    浏览(35)
  • 计算机视觉(三)图像拼接

    1.1 流程 要拼接多张图像,就一定要找到他们之间的映射关系,流程如下: 得到映射关系,就能进行拼接: 简而言之,拼接两张图像,就是找到他们的特征点,根据这些特征点: 1.2 映射与处理 找到两张图像的像素点对应关系,然后把第二张图像映射到在第一张图像的坐标系

    2024年02月05日
    浏览(82)
  • 读十堂极简人工智能课笔记04_计算机视觉

    3.2.3.1. 应该发现真正的边缘,而尽量避免错报 3.2.4.1. 应该正确地找出边缘的确切位置 3.2.5.1. 每条实际的边缘应该检测为一条边缘,而不是多条边缘 4.7.5.1. 有数以百万计的几乎任何种类的图像例子 4.7.7.1. 神经网络自己就能完成这一切

    2024年02月19日
    浏览(35)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包