Image Super-Resolution via Iterative Refinement 论文笔记

这篇具有很好参考价值的文章主要介绍了Image Super-Resolution via Iterative Refinement 论文笔记。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

前言

基于Diffusion Model来做的超分辨,与以往基于GAN和CNN网络的不一样,Diffusion Model是从低分辨率图像中学习噪声然后通过UNet来估计噪声,再进行噪声去除来还原图像。主要是基于DDPM这篇论文的理论上进行改进的,相比其他方法来说可以很好的还原图像的高频信息,虽然在PSNR和SSIM指标上一般,但是实际出来的效果来说还是不错的,并且也证明了Diffusion Model这种生成模型在超分辨上方法也是可行的。

网络框架

这篇的网络框架基本是基于DDPM上面进行了略微的改进,区别是出来的图像不是随机生成的,是对低分辨率图像作为条件进行生成的。

主要分为两个阶段,一个是高斯噪声扩散过程,主要是在对模型进行训练的时候,给图像不断地添加随机的高斯噪声,然后通过UNet网络对噪声进行估计,通过估计之后的噪声与原添加的噪声进行对比,损失函数就是使得这两个噪声最可能接近,以此来训练出一个很好的噪声推理网络;第二个阶段是推理阶段,就是当训练好网络后,输入一张低分辨率的图片估计当前噪声然后进行推理直至还原到高分辨率。

Gaussian Diffusion Process

Image Super-Resolution via Iterative Refinement 论文笔记

如上图所示就是训练阶段,原图x0对应的就是GT图像,首先均匀采样一个t和噪声z,然后通过上面那条式子估计出第t步的噪声图像xt,是固定的参数,它的选取依赖于t,于是就得到了xt对应的图像,这个过程是一步到位的,不是一步步加噪声推理出来的xt,上面的图片只是为了方便理解。然后通过xt对应的图像和低分辨率图像进行三次线性插值后的图像进行拼接得到的就是6通道的图像,作为条件输入到Unet网络进行估计当前噪声,然后对于下图来说就是损失函数(=,对应的就是Unet的网络模型),就是估计原来采样的噪声和估计的噪声的差距,并且使得尽可能接近。

Image Super-Resolution via Iterative Refinement 论文笔记

Inference via Iterative Refinement

Image Super-Resolution via Iterative Refinement 论文笔记推理阶段如上图,首先经过随机采样得到一个xt,然后和低分辨率图像经过三次线性插值后进行拼接作为条件,输入到Unet网络对当前噪声进行估计,然后通过上面的式子对噪声进行去除,得到xt- 1的噪声图,然后继续循环这个过程,得到xt-2的噪声图,以此类推直到得到x0的高分辨率图像。

改进

与DDPM模型不一样的地方在于:

①作为有条件生成模型,是将低分辨率图像进行三次线性插值后与噪声图进行拼接作为输入估计噪声。

②在DDPM中的是基于采样得到的t进行选取的参数,但是在SR3中的不再直接取,而是在采样得到t之后,经过和之间均匀分布进行选取,使得过程更加连续。

③不再输入t给Unet,而是直接输入noise level,即②中得到的  作为Unet的输入。

实验

Image Super-Resolution via Iterative Refinement 论文笔记

对比了GAN和PULSE模型和自回归模型,在PSNR和SSIM上的效果相对比较一般,另外还弄了个一致性的指标,因为相对其传统的超分辨模型都是基于PSNR进行训练的,而SR3不是,所以指标相对较低也正常。

Image Super-Resolution via Iterative Refinement 论文笔记

 对比和自回归模型上的差异,自回归模型是基于PSNR进行训练的,SR3 是利用FID去寻找噪声的Z的,因而各自有优势。

Image Super-Resolution via Iterative Refinement 论文笔记

这个表展示了在imganet上进行训练后的超分辨图的分类准确率的情况,可以看到SR3确实有一定的优势,这类实验展示的是超分辨后的图像对目标检测等任务的提升程度。

Image Super-Resolution via Iterative Refinement 论文笔记

Image Super-Resolution via Iterative Refinement 论文笔记

 最后还用了一个Foolrate,用人眼来分辨超分辨图片哪个更接近低分辨率的图片,可以看到SR3在欺骗人眼的能力上有非常显著的效果。

总结

 SR3的模型使用了一种全新的超分辨思路,与以往的基于GAN和CNN网络的完全不一样,主要是通过图像的概率分布来对图像进行不断降噪来获取超分辨的图像。实验结果来说因为没有使用PSNR等指标作为损失函数,虽然在这些指标的领域比较一般,但是在其他实验上还是有非常不错的效果。尤其个人认为在imagenet上分辨从错误率上得到了提升,当然其实并没有对比SOTA的模型,所以缺乏一定的说服力,但是总的来说这个思路是有效果的,而且有很大的提升空间。

 文章来源地址https://www.toymoban.com/news/detail-481299.html

到了这里,关于Image Super-Resolution via Iterative Refinement 论文笔记的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • BSRN网络——《Blueprint Separable Residual Network for Efficient Image Super-Resolution》论文解读

    目录 摘要: 网络架构: 具体流程: BSConv: ESDB——Efficient Separable Distillation Block:  Blueprint Shallow Residual Block (BSRB): ESA和CCA:  实验: BSRN的实现细节: BSRN-S(比赛)的实现细节: 不同卷积分解的效果: ESA和CCA的有效性:  不同激活函数对比: BSRN的有效性:  和SOTA方法的

    2024年02月05日
    浏览(47)
  • 阅读RFDN-Residual Feature Distillation Network for Lightweight Image Super-Resolution

    Residual Feature Distillation Network for Lightweight Image Super-Resolution Abstract. 单图像超分辨率(SISR)的最新进展探索了卷积神经网络(CNN)的力量,以获得更好的性能。尽管基于cnn的方法取得了巨大的成功,但为了解决高计算量的问题,人们提出了各种快速和轻量级的CNN模型。信息蒸馏

    2024年02月10日
    浏览(44)
  • 【论文阅读】SISR综述:From Beginner to Master: A Survey for Deep Learning-based Single-Image Super-Resolution

    论文地址:https://doi.org/10.48550/arXiv.2109.14335 单幅图像超分辨率(SISR)是图像处理中的一项重要任务,旨在提高成像系统的分辨率。近年来,在深度学习(DL)的帮助下,SISR取得了巨大的飞跃,并取得了可喜的成果。在本综述中,我们对基于dl的SISR方法进行了概述,并根据重建效率

    2024年02月08日
    浏览(50)
  • 论文阅读 Self-Supervised Burst Super-Resolution

    这是一篇 ICCV 2023 的文章,主要介绍的是用自监督的方式进行多帧超分的学习 Abstract 这篇文章介绍了一种基于自监督的学习方式来进行多帧超分的任务,这种方法只需要原始的带噪的低分辨率的图。它不需要利用模拟退化的方法来构造数据,而且模拟退化的方法又可能存在域

    2024年01月18日
    浏览(57)
  • 论文阅读《Spherical Space Feature Decomposition for Guided Depth Map Super-Resolution》

    论文地址:https://openaccess.thecvf.com/content/ICCV2023/papers/Zhao_Spherical_Space_Feature_Decomposition_for_Guided_Depth_Map_Super-Resolution_ICCV_2023_paper.pdf 源码地址: https://github.com/Zhaozixiang1228/GDSR-SSDNet   GDSR是一种多模态图像处理的热门话题,它的目的是利用同一场景中的高分辨率(HR)RGB图像中

    2024年01月16日
    浏览(43)
  • Temporal Modulation Network for Controllable Space-Time Video Super-Resolution阅读笔记

    Temporal Modulation Network for Controllable Space-Time Video Super-Resolution 可控时空视频超分辨率的时间调制网络  论文:https://arxiv.org/pdf/2104.10642v2.pdf 代码:https://github.com/CS-GangXu/TMNet 研究机构:南开、中科院、腾讯优图 本篇笔记主要对整篇论文从头到尾进行阅读分析,本文内容有点多,

    2023年04月14日
    浏览(38)
  • 论文阅读:Feature Refinement to Improve High Resolution Image Inpainting

    项目地址:https://github.com/geomagical/lama-with-refiner 论文地址:https://arxiv.org/abs/2109.07161 发表时间:2022年6月29日 项目体验地址:https://colab.research.google.com/github/advimman/lama/blob/master/colab/LaMa_inpainting.ipynb#scrollTo=-VZWySTMeGDM 解决了在高分辨率下工作的神经网络的非绘制质量的下降问题

    2024年01月17日
    浏览(45)
  • 【论文阅读笔记】Bicubic++: Slim, Slimmer, Slimmest Designing an Industry-Grade Super-Resolution Network

    论文地址:https://arxiv.org/pdf/2305.02126.pdf   本文提出的实时性、轻量级的图像超分网络,名为 Bicubic++ 。   Bicubic++的网络结构,首先学习了图像的快速可逆降级和低分辨率特征,以减少计算量。   然后作者还设计了一个训练管道,可以在不使用幅度或梯度(magnitude or

    2024年04月17日
    浏览(43)
  • Perceptual Loss(感知损失)&Perceptual Losses for Real-Time Style Transferand Super-Resolution论文解读

    由于传统的L1,L2 loss是针对于像素级的损失计算,且L2 loss与人眼感知的图像质量并不匹配,单一使用L1或L2 loss对于超分等任务来说恢复出来的图像往往细节表现都不好。 现在的研究中,L2 loss逐步被人眼感知loss所取代。人眼感知loss也被称为perceptual loss(感知损失),它与MSE(

    2023年04月20日
    浏览(51)
  • Self-Polish: Enhance Reasoning in Large Language Models via Problem Refinement

    文章链接 核心思想是通过instruction让LLM来优化问题本身,从而达到更好的效果,且这种针对问题的优化可以跟其他的prompt技术,如CoT或者Least-to-Most相结合。 作者提出了一些重述问题的准则: (1)简短:问题不要太长,确保容易理解 (2)清晰:问题表述清晰,能量化的部分

    2024年02月08日
    浏览(39)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包