[论文阅读]Ghost-free High Dynamic Range Imaging with Context-aware Transformer

这篇具有很好参考价值的文章主要介绍了[论文阅读]Ghost-free High Dynamic Range Imaging with Context-aware Transformer。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

背景介绍

高动态范围成像(HDR)是一种图像技术,它能够捕捉到比传统图像更广泛的亮度范围。1997年,Paul Debevec在他的论文《Recovering High Dynamic Range Radiance Maps from Photographs》中提出了HDR的概念。论文里提出可以通过对同一个场景进行不同曝光时间的拍摄,然后用这些低动态范围 (LDR) 图像合成一张高动态范围(HDR)图像。这样做可以捕捉到从暗部的阴影到亮部的高光,或者说是高反光的更大动态范围的场景。

HDR技术主要应用于高对比度场景,比如风景照、阳光下的人物、弱光和背光场景等。在这些情况下,HDR可以有效地捕捉到细节和颜色,增强图像的视觉效果。在显示设备上,HDR技术也被广泛应用于电视、显示器和手机等设备,以提升图像的亮度和颜色表现,从而带来更真实的视觉体验。

然而,在实际拍摄过程中,图像容易受到相机、物体运动的干扰,导致三张低动态范围图像往往不能很好地对齐。直接对这些图像做融合的话,所生成的图像容易产生伪影、重影等问题。

已有算法

为了解决这些问题,人们提出了各种方法,通常称为HDR去重影算法,以获得高质量的无重影HDR图像。
这些算法通常分为两类:

  • 一类是传统算法,如在图像融合前对图像进行对齐或者拒绝不对齐的像素来去除重影,但这种方法往往难以实现精确的对齐或定位不对齐的像素,因此所生成的HDR图像效果并不好;
  • 另一类是基于CNN的去重影方法,主要分为两类:
    – 第一类是使用单调或光流对LDR图像进行预对齐,然后使用CNN进行多帧融合和HDR重建,但在面对前景中的动态物体、存在遮挡和饱和的情况时,光流是不可靠的;
    – 第二类是具有隐式对齐模块或新颖的学习策略的端到端网络来处理重影伪影,从而实现最先进的性能,但当面对远距离物体运动和剧烈的强度变化时,卷积的内在局部性限制就会出现,使结果产生意想不到的重影和失真伪像。

本文算法

[论文阅读]Ghost-free High Dynamic Range Imaging with Context-aware Transformer,2023新征程,论文阅读,transformer,深度学习
本文作者提出了一种上下文感知的ViT(Context-Aware Vision Transformer, CA-ViT),通过双分支架构来同时捕获全局和局部的依赖关系,也就是同时实现全局和局部的建模。对于全局分支,作者使用基于窗口的多头transformer编码器来捕远程上下文关系(即Swin transformer);对于局部分支,作者设计了局部上下文提取器(local context extractor, LCE),通过卷积块来提取局部特征映射,并且通过通道注意力机制在多个帧特征之间选择有用的特征,抑制无用的特征,因此,CA-ViT结构可以使全局和局部以互补的方式发挥作用。基于CA-ViT结构,作者提出了用于HDR成像的transformer结构(HDR-Transformer)。
[论文阅读]Ghost-free High Dynamic Range Imaging with Context-aware Transformer,2023新征程,论文阅读,transformer,深度学习
对于HDR-Transformer,主要包括两个模块:特征提取网络和HDR恢复网络,特征提取网络利用卷积运算和空间注意力模块来提取浅层特征,并且进行粗融合,有助于稳定transformer的训练和抑制图像中不对齐的像素。HDR重建模块以CA-ViT为基本组件,从全局和局部两个角度对图像建模,有助于重建高质量的HDR图像,同时无需堆叠非常深的卷积块。

实验对比

将HDR-Transformer的结果与几种最先进的方法进行了比较,其中包括两种基于贴片匹配的方法和五种基于CNN的方法。HDR-Transformer重建了无鬼影的结果,同时在这些区域产生了更精确的边界。
  
[论文阅读]Ghost-free High Dynamic Range Imaging with Context-aware Transformer,2023新征程,论文阅读,transformer,深度学习文章来源地址https://www.toymoban.com/news/detail-733710.html

到了这里,关于[论文阅读]Ghost-free High Dynamic Range Imaging with Context-aware Transformer的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Nerf论文阅读笔记Neuralangelo: High-Fidelity Neural Surface Reconstruction

    公众号:AI知识物语;B站暂定;知乎同名 视频入门介绍可以参考 B站——CVPR 2023最新工作!Neuralangelo:高保真Nerf表面重建 https://www.bilibili.com/video/BV1Ju411W7FL/spm_id_from=333.337.searchcard.all.clickvd_source=03387e75fde3d924cb207c0c18ffa567 图1所示。本文提出Neuralangelo,一种用神经体渲染从RGB图像

    2024年02月08日
    浏览(46)
  • 论文阅读:Rethinking Range View Representation for LiDAR Segmentation

    来源ICCV2023 LiDAR分割对于自动驾驶感知至关重要。最近的趋势有利于基于点或体素的方法,因为它们通常产生比传统的距离视图表示更好的性能。在这项工作中,我们揭示了建立强大的距离视图模型的几个关键因素。我们观察到, “多对一”的映射 , 语义不连贯性 , 形状变

    2024年02月02日
    浏览(52)
  • 论文阅读 | Restormer: Efficient Transformer for High-Resolution Image Restoration

    前言:CVPR2022oral 用transformer应用到low-level任务 low-level task 如deblurringdenoisingdehazing等任务多是基于CNN做的,这样的局限性有二: 第一是卷积操作的感受野受限,很难建立起全局依赖, 第二就是卷积操作的卷积核初始化是固定的,而attention的设计可以通过像素之间的关系自适

    2024年02月05日
    浏览(52)
  • 论文阅读--High-Resolution Image Synthesis with Latent Diffusion Models

    High-Resolution Image Synthesis with Latent Diffusion Models论文阅读 Abstract Introduction Diffusion model相比GAN可以取得更好的图片生成效果,然而该模型是一种自回归模型,需要反复迭代计算,因此训练和推理代价都很高。论文提出一种在潜在表示空间(latent space)上进行diffusion过程的方法,

    2024年01月17日
    浏览(64)
  • 论文阅读《Generalizing Face Forgery Detection with High-frequency Features》

    高频噪声分析会过滤掉图像的颜色内容信息。 本文设计了三个模块来充分利用高频特征, 1.多尺度高频特征提取模块 2.双跨模态注意模块 3.残差引导空间注意模块(也在一定程度上体现了两个模态的交互) SRM是用于过滤图像的高频噪声 输入的图像X,共两个分支,一部分是用

    2024年01月25日
    浏览(44)
  • 论文阅读--Cell-free massive MIMO versus small cells

    论文信息 Ngo H Q, Ashikhmin A, Yang H, et al. Cell-free massive MIMO versus small cells[J]. IEEE Transactions on Wireless Communications, 2017, 16(3): 1834-1850.   无蜂窝大规模MIMO中没有小区或者小区边界的界定,所有接入点通过回程网络进行相位相干协作,并通过时分双工(TDD)操作为同一时频资源中的

    2024年02月07日
    浏览(41)
  • Deep learning of free boundary and Stefan problems论文阅读复现

    在这项工作中,作者提出了一个基于物理信息神经网络的多网络模型,来解决一类一般的正和逆自由边界问题,称为Stefan问题。具体地说,用两个深度神经网络来近似未知解以及任何移动边界。作者提供了三个案例研究(一维一相Stefan问题,一维二相Stefan问题,二维一相Ste

    2024年02月08日
    浏览(49)
  • 【论文阅读】Foundations of Dynamic BFT --- IEEE S&P ‘22

    本文研究了动态 BFT,其中副本可以动态地加入和离开系统,这是当今越来越需要的一种原语。我们为动态 BFT 协议提供形式化处理,赋予它们灵活的语法和各种安全定义。 我们展示了将静态 BFT 扩展到动态 BFT 的挑战。然后我们设计并实现了部分同步模型下的高效动态 BFT 协议

    2024年02月08日
    浏览(46)
  • 论文阅读:SDXL Improving Latent Diffusion Models for High-Resolution Image Synthesis

    论文链接 代码链接 背景:Stable Diffusion在合成高分辨率图片方面表现出色,但是仍然需要提高 本文提出了SD XL,使用了更大的UNet网络,以及增加了一个Refinement Model,以进一步提高图片质量。 用户偏好调查比较 可以看到,在不增加Refiner模型的情况下,SD XL的效果已经比SD 1.

    2024年03月11日
    浏览(84)
  • 【论文阅读】A High-Performance CNN Processor Based on FPGA for MobileNets

    基于FPGA的mobilenet高性能CNN处理器 缺陷: CNN由于参数量巨大难以部署到嵌入式设备上。 背景 : MobileNet ,which adopts depthwise separable convolution to replace the standard convolution has significantly reduce operations and parrameters with only limited loss in accuracy. 研究的问题 : A high-performance CNN processor b

    2024年01月16日
    浏览(38)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包