论文阅读——CRNet: Channel-Enhanced Remodeling-Based Network for Salient Object Detection in Optical

这篇具有很好参考价值的文章主要介绍了论文阅读——CRNet: Channel-Enhanced Remodeling-Based Network for Salient Object Detection in Optical。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

为什么要看这篇

这篇是老师发的,主要是用来解决遥感显著性检测的边缘问题

基本信息

期刊 IEEE TRANSACTIONS ON GEOSCIENCE AND REMOTE SENSING
年份 2023
论文地址 https://ieeexplore.ieee.org/abstract/document/10217013
代码地址 https://github.com/hilitteq/CRNet.git

标题

CRNet:一种基于网格增强重构的光学遥感图像显著目标检测网络

目前存在的问题

  1. 除了它们的尺寸差异之外,这些目标由于拍摄距离而具有不同的目标尺度大小
  2. 小物体在整个图像中占较少的像素,使得在网络训练期间更难以学习。而且,网络模型在学习ORSIs的过程中面向大对象,而小对象容易被忽略,导致检测效果不佳
  3. ORSIs覆盖的视场范围大,背景信息复杂多样,对显著目标的检测会产生很强的干扰

改进

  1. 对于浅层特征,我们创建了一个通道增强模块(CEM),该模块结合了通道注意(CA)机制和局部通道交互。这个模块有助于建立边界细节,同时减少复杂背景和阴影的干扰
  2. 对于语义更丰富的深层特征,我们提出了重定义特征模块(redefined feature module, RFM),通过重构全局上下文语义信息来实现显著性目标的完整检测
  3. 解码器模块的融合过程以逐步恢复分辨率的方式推断出显著目标,结合定位和细节填充完成检测任务

网络结构

orsi-4199,论文阅读,论文阅读,目标检测,人工智能

Feature-Enhanced Encoder(功能增强的编码器)
首先,我们将浅层特征f1和f2输入CEM。然后,通过CA机制和群卷积实现了去除冗余背景信息和精细表达前景细节的功能。最后生成信道增强特征F1和F2。对于深度特征f3 - f5,采用RFM进行特征结构变换。利用目标像素和通道之间的语义相关性,生成重构增强特征F3-F5

CEM(Channel Enhance Module)
浅层特征具有较高的空间分辨率,包含更详细的信息,有利于不同尺度下显著性目标的恢复,尤其是小目标。
orsi-4199,论文阅读,论文阅读,目标检测,人工智能
RFM(Refined Feature Module)
同一物品的多个目标具有相同的视觉和语义特征。在识别出一种目标后,相似的语义关联有助于检测出同一类型的目标。构建不同空间区域之间的相关性有助于检测结构完整的目标,基于图的模型可以有效地推断上下文语义相关性。因此,我们可以通过图变换来增强像素之间的语义相关性,定位目标位置,聚合目标结构。
orsi-4199,论文阅读,论文阅读,目标检测,人工智能
Progressive Fusion Decoder(渐进式融合解码器)
orsi-4199,论文阅读,论文阅读,目标检测,人工智能

损失函数

BCE+IOU

训练

ORSSD,EORSSD,ORSI-4199,初始学习率5e-5,最小学习率5e-6,epoch为50

测试

ORSSD,EORSSD

我的总结

总的来说,浅层特征和深层特征走的路径不同文章来源地址https://www.toymoban.com/news/detail-771618.html

到了这里,关于论文阅读——CRNet: Channel-Enhanced Remodeling-Based Network for Salient Object Detection in Optical的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【论文笔记】Boros: Secure Cross-Channel Transfers via Channel Hub

    原文:https://arxiv.org/pdf/1911.12929.pdf 学习一下人家的论文怎么写的 摘要 :针对支付网络通道的主要问题——多条路由的交易需要路径上节点锁定一笔交易,来辅助完成这笔跟他无关的交易,这样的设计一方面限制了中间节点的资金流动性,一方面有时会导致死锁进而交易失败

    2024年02月11日
    浏览(28)
  • 【论文笔记】PSCC-Net: Progressive Spatio-Channel Correlation Network for Image Manipulation Detection and

    PSCC-Net: Progressive Spatio-Channel Correlation Network for Image Manipulation Detection and Localization 发布于IEEE Transactions on Circuits and Systems for Video Technology 2021 论文链接:https://arxiv.org/pdf/2103.10596v2.pdf 一作开源代码:https://github.com/proteus1991/pscc-net 开发了一种 渐进式空间通道相关网络 (PSCC-Net) 对图

    2024年02月01日
    浏览(36)
  • 论文阅读:Vary论文阅读笔记

    论文:Vary: Scaling up the Vision Vocabulary for Large Vision-Language Models Paper | Github | Demo 许久不精读论文了,内心一直想找个专门的时间来细细品读自己感兴趣的论文。现在想来,无异于是自己骗自己了,因为根本就不存在那个专门的时间。所以改变最好的时候就是现在。 因为自己一

    2024年01月19日
    浏览(35)
  • 【论文阅读】(20230410-20230416)论文阅读简单记录和汇总

    2023/04/09:很久没有动笔写东西了,这两周就要被抓着汇报了,痛苦啊呜呜呜呜呜 (CVPR 2023): Temporal Interpolation Is All You Need for Dynamic Neural Radiance Fields (ICCV 2021):Video Autoencoder: self-supervised disentanglement of static 3D structure and motion (CVPR 2023):DINER: Disorder-Invariant Implicit Neural Representat

    2024年02月12日
    浏览(29)
  • 论文阅读:Vary-toy论文阅读笔记

    论文:Small Language Model Meets with Reinforced Vision Vocabulary Paper | Github | Demo 说来也巧,之前在写论文阅读:Vary论文阅读笔记文章时,正好看到了Vary-toy刚刚发布。 这次,咱也是站在了时代的前沿,这不赶紧先睹为快。让我看看相比于Vary,Vary-toy做了哪些改进? 从整体结构来看,仍

    2024年01月25日
    浏览(43)
  • 论文阅读:TinyGPT-V 论文阅读及源码梳理对应

    引言 TinyGPT-V来自论文:TinyGPT-V: Efficient Multimodal Large Language Model via Small Backbones,是一篇基于较小LLM作为backbone的多模态工作。相关工作已经开源,地址为:Github 之所以选择这篇文章,是因为比较具有落地意义,且便于本地运行,查看和调试。 以下代码只给出核心部分,会省

    2024年01月16日
    浏览(48)
  • 论文阅读1---OpenCalib论文阅读之factory calibration模块

    该论文的标定间比较高端,一旦四轮定位后,可确定标定板与车辆姿态。以下为本人理解,仅供参考。 工厂标定,可理解为车辆相关的标定,不涉及传感器间标定 该标定工具不依赖opencv;产线长度一般2.5米 Factory Calibration Tools:四轮定位+多位姿标定板 1)根据传感器安装位姿

    2024年01月25日
    浏览(40)
  • 【论文阅读】(2023.06.09-2023.06.18)论文阅读简单记录和汇总

    2023/06/09:虽然下周是我做汇报,但是到了周末该打游戏还是得打的 2023/06/12:好累好困,现在好容易累。 (TCSVT 2023)Facial Image Compression via Neural Image Manifold Compression (arxiv 2023)Exploring the Rate-Distortion-Complexity Optimization in Neural Image Compression (arxiv 2023)High-Similarity-Pass Attenti

    2024年02月09日
    浏览(29)
  • 【论文阅读】视线估计方向论文

    2022年过去,总结一下已经看过的论文的汇总以及对开展实验的一点想法: 首先,参考[1]中提出的分类,可以将 视线估计(gaze estimation) 分为: 注视目标估计 (gaze target detection,or gaze following),跨帧的视频注视目标估计; 注视点估计 ,估算人双目视线聚焦的在一个二维屏

    2023年04月08日
    浏览(95)
  • 【论文阅读】视频理解系列论文精读

    视频理解论文串讲(上)【论文精读】 我们研究了多种扩展CNN在时域上的连接性的方法,以利用局部的时空信息,并建议采用多分辨率、凹陷的架构作为加速训练的一种有希望的方式。 在图像领域积极成果的鼓舞下,我们研究了CNN在大规模视频分类中的表现,在这种情况下

    2023年04月09日
    浏览(28)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包