Fast Fourier Convolution

这篇具有很好参考价值的文章主要介绍了Fast Fourier Convolution。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

Fast Fourier Convolution

Fast Fourier Convolution,深度学习,计算机视觉,人工智能

背景:

感受野的概念: 卷积神经网络每一层输出的特征图(feature map)上的像素点映射回输入图像上的区域大小

例如:

Fast Fourier Convolution,深度学习,计算机视觉,人工智能

扩大感受野的方法:非局部神经网络、膨胀卷积或可变形卷积

非局部神经网络:为了确定某个位置的新值,它计算该位置与所有其他位置的相似性得分,然后对所有位置的特征进行加权平均。

Fast Fourier Convolution,深度学习,计算机视觉,人工智能

其中i为输入位置,j为所有搜索的位置

缺点:低效率

膨胀卷积或可变形卷积:本质上还是局部的,需要堆叠很多层才能获得大感受野

缺点:深度网络优化更困难、容易产生伪影。

创新点:

提出了一个新的卷积模块,fast Fourier convolution(FFC) ,不仅有非局部的感受野,而且在卷积内部就做了跨尺度信息的融合。

FFC构架:

Fast Fourier Convolution,深度学习,计算机视觉,人工智能

FFC由两条相互连接的路径组成:一条在部分输入特征信道上进行普通卷积的空间(局部)路径,以及一条在频谱域中工作的频谱(全局)路径。每条路径都可以捕获具有不同感受野的互补信息。

Fast Fourier Convolution,深度学习,计算机视觉,人工智能

Fourier Unit(FU)

性质1:对实信号应用二维FFT时,会产生完全对称的厄米特矩阵,对厄米特矩阵应用逆FFT时矩阵只有实元素。当用实张量进行FFT变换时,其结果是共轭对称的。因此,在不损失有用信息的情况下,我们可以只保留一半的结果,并通过使用共轭对称简单地恢复另一半。

性质2:傅里叶理论中的频谱卷积定理:更新频谱域中的单个值会影响空间域中全局的特征。

Fast Fourier Convolution,深度学习,计算机视觉,人工智能

Fast Fourier Convolution,深度学习,计算机视觉,人工智能

对于频谱变换器来说,大的核尺寸是不必要的,因为在频谱域中的任何操作都具有全局感受野。

Local Fourier Unit(LFU)

Fast Fourier Convolution,深度学习,计算机视觉,人工智能

目的是捕捉半全局信息,做法是将input feature map分为4个patch,分别使用FU即可。

与FU相比,LFU需要更高的计算复杂度,这主要是由于增加了信道。LFU的效果因具体任务而异

复杂性分析:

Fast Fourier Convolution,深度学习,计算机视觉,人工智能

FFC与普通卷积相比,计算成本相当,但当普通卷积使用大核卷积时,FFC体现了优越性,在频谱转换器时仍然使用1×1的核来学习全局感受野。

总结:提出了一种新的卷积算子,称为FFC。它利用傅里叶光谱理论在深度模型中实现非局部感受野。所提出的算子也经过设计以实现跨尺度融合。在三个具有代表性的计算机视觉任务上的综合实验证明FFC的有效性。

应用到图像修复当中

            Resolution-robust Large Mask Inpainting with Fourier Convolutions

Fast Fourier Convolution,深度学习,计算机视觉,人工智能

背景:

针对问题:复杂几何结构的高分辨率图像缺失较大时修复效果不好。

作者认为:主要原因之一是修复网络和损失函数都缺乏有效感受野。

创新点:

1、提出了基于快速傅里叶卷积(FFC)的修复网络,可以在网络比较浅的层就有覆盖图像的感受野

2、应用了具有高感受野的语义分割网络的感知loss

3、引入了一种训练掩码生成的策略,可以生成多样性的Mask。

方法:

      问题定义:

Fast Fourier Convolution,深度学习,计算机视觉,人工智能

Fast Fourier Convolution,深度学习,计算机视觉,人工智能

在大掩模修复中,需要充分的考虑全局的上下文信息。因此一个好的架构需要在网络比较浅的地方就能够有较宽的感受野,对于宽掩模,特定位置的生成器的整个感受野可能在掩模内部,因此仅观察丢失的像素。对于高分辨率图像,这个问题变得尤为突出,不太适用。

Fast Fourier Convolution,深度学习,计算机视觉,人工智能

快速傅里叶卷积(FFC):FFC是可以在浅层中使用全局上下文的算子,FFC基于通道级别的FFT,并且有覆盖整个图像的感受野。

FFC设计上在通道级别分为两个分支:使用传统卷积的局部分支和使用FFT获取全局上下文信息的全局分支。

Fast Fourier Convolution,深度学习,计算机视觉,人工智能

在重复结构上的修复示例

FFC可以在网络的浅层就开始考虑全局上下文信息,对于高分辨率图像来说十分有用。同时FFC非常适合捕获周期性的结构

Loss的设计:

原始的监督损失要求生成器尽可能地去还原 Ground Truth。但是当遮挡区域很大时,已有的可见区域的信息不足以还原,因此模型会做出很多模棱两可的判断,从而导致模糊

Fast Fourier Convolution,深度学习,计算机视觉,人工智能

利用一个预训练模型来评估预测图和目标图之间的距离。因为针对large mask 的修复问题的重点是理解图像的全局结构,因此不需要精确的还原,允许有一定的变化。

Fast Fourier Convolution,深度学习,计算机视觉,人工智能

预训练模型的选取也很重要,分割模型会关注图像的高级语义信息,而分类模型可能会更关注图像的纹理。

大掩膜训练:

Fast Fourier Convolution,深度学习,计算机视觉,人工智能

Fast Fourier Convolution,深度学习,计算机视觉,人工智能

Fast Fourier Convolution,深度学习,计算机视觉,人工智能

  • 实验结果:超过了以往的 SOTA 模型,鲁棒性更好,扩展到高分辨率图像同样适用,且参数量和时间也更少。

Fast Fourier Convolution,深度学习,计算机视觉,人工智能

Fast Fourier Convolution,深度学习,计算机视觉,人工智能

存在不足:

1、对于变形的周期信号复原结果不佳。

2、在透视与复杂背景上表现不好文章来源地址https://www.toymoban.com/news/detail-693518.html

到了这里,关于Fast Fourier Convolution的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 《计算机视觉度量:从特征描述到深度学习》--工业视觉深度学习方法概述

    博主更新了几期关于深度学习在工业场景的应用文章,本次全面阐述一下深度学习方法在整个应用场景的方法和应用的局限特性: 分类:分类作为深度学习基本的研究方向,这几年的学术研究取得了重大突破。基本原理如下图 原理分析:采用图片的每个像素值,通过深度学

    2024年02月20日
    浏览(49)
  • 深度学习与计算机视觉教程(8) | 常见深度学习框架介绍(CV通关指南·完结)

    本系列为 斯坦福CS231n 《深度学习与计算机视觉(Deep Learning for Computer Vision)》的全套学习笔记,对应的课程视频可以在 这里 查看。更多资料获取方式见文末。 大家在前序文章中学习了很多关于神经网络的原理知识和实战技巧,在本篇内容中ShowMeAI给大家展开介绍深度学习硬件

    2024年02月19日
    浏览(44)
  • 【学习笔记】计算机视觉深度学习网络模型

    这是本人学习计算机视觉CV领域深度学习模型的学习的一点点学习笔记,很多片子没有完成,可以作为学习的参考~

    2024年04月10日
    浏览(68)
  • 深度学习与计算机视觉

    目录 1 深度学习 1.1 人工智能 1.2 机器学习 1.3 深度学习 1.3.1 深度学习发展历程 1.3.2 深度学习中的核心因素 1.3.3 深度学习模型分类 1.3.4 深度学习框架 2 计算机视觉 人工智能、机器学习、深度学习这三者的关系: 在实现人工智能的众多算法中,机器学习是发展较为快速的

    2024年02月06日
    浏览(44)
  • 深度学习常用的Python库(核心库、可视化、NLP、计算机视觉、深度学习等)

    (1)核心库与统计:Numpy、Scipy、Pandas、StatsModels。 (2)可视化:Matplotlib、Seaborn、Plotly、Bokeh、Pydot、Scikit-learn、XGBoost/LightGBM/CatBoost、Eli5。 (3)深度学习:Tensorflow、PyTorch、Keras。 (4)分布式深度学习:Dist-keras/elephas/spark-deep-learning。 (5)自然语言处理:NLTK、SpaCy、Gens

    2024年02月09日
    浏览(47)
  • 计算机视觉(五)深度学习基础

    深度学习与神经网络的区别 选择合适的目标函数 Softmax层 梯度消失的直观解释 激活函数 学习步长 SGD的问题 存在马鞍面,使我们的训练卡住,于是提出下面方法: Momentum动量 Nesterov Momentum 先利用“惯性”,“走”一步。避免一开始,就被当前梯度带偏。 Adagrad 为不同的参数

    2024年02月14日
    浏览(52)
  • 深度学习与计算机视觉的创新

    深度学习和计算机视觉是现代人工智能领域的两个重要分支。深度学习是一种通过多层神经网络来处理大规模数据的机器学习方法,而计算机视觉则是利用计算机程序来模仿人类视觉系统对图像进行分析和理解的技术。在过去的几年里,深度学习与计算机视觉的融合已经取得

    2024年04月09日
    浏览(47)
  • 计算机视觉(三)未有深度学习之前

    把图像划分成若干互不相交的区域。 经典的数字图像分割算法一般是基于灰度值的两个基本特征之一:不连续性和相似性。 基于阈值:基于图像灰度特征计算一个或多个灰度阈值。将灰度值与阈值比较,最后将比较结果分到合适的类别中。 大津法 基于边缘:边界线上连续的

    2024年02月15日
    浏览(48)
  • 计算机竞赛 垃圾邮件(短信)分类算法实现 机器学习 深度学习

    🔥 优质竞赛项目系列,今天要分享的是 🚩 垃圾邮件(短信)分类算法实现 机器学习 深度学习 该项目较为新颖,适合作为竞赛课题方向,学长非常推荐! 🥇学长这里给一个题目综合评分(每项满分5分) 难度系数:3分 工作量:3分 创新点:4分 🧿 更多资料, 项目分享: https:

    2024年02月11日
    浏览(50)
  • 计算机竞赛 深度学习卷积神经网络垃圾分类系统 - 深度学习 神经网络 图像识别 垃圾分类 算法 小程序

    🔥 优质竞赛项目系列,今天要分享的是 深度学习卷积神经网络垃圾分类系统 该项目较为新颖,适合作为竞赛课题方向,学长非常推荐! 🧿 更多资料, 项目分享: https://gitee.com/dancheng-senior/postgraduate 近年来,随着我国经济的快速发展,国家各项建设都蒸蒸日上,成绩显著。

    2024年02月07日
    浏览(55)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包