U-Net Transformer:用于医学图像分割的自我和交叉注意力模块

这篇具有很好参考价值的文章主要介绍了U-Net Transformer:用于医学图像分割的自我和交叉注意力模块。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

Abstract-摘要

对于复杂和低对比度的解剖结构,医学图像分割仍然特别具有挑战性。本文提出的一种U-Transformer网络,它将Transformer中的self-attention和Cross attention融合进了UNet,这样克服了UNet无法建模长程关系和空间依赖的缺点,从而提升对关键上下文的分割。本文集合了两种注意力机制:自注意力机制建立编码器之间的全局交互,交叉注意力被添加到跳跃连接当中。通过过滤非语义特征在UNet Decoder中恢复空间信息。

Introduction

尽管FCN,Unet系列都取得了不错的性能,但是仍然具有局限性,这种网络结构处理有局部二义性或者低对比度器官时表现不佳。

本文提出的U-Transformer,借助Transformer的特性来帮助建模长程依赖关系和空间依赖关系,U-Transformer保留了原始的U型架构提取归纳偏置,此外引入了两种注意力机制来改善网络的决策能力。

首先。self-attention在编码器的结尾用来显式的建模语义之间的全局交互关系,其次在跳跃连接中加入了Cross attention从而过滤到非语义特征,从而更好的协助U-Net恢复空间信息。

The U-Transformer结构

U型网络的编码器结构可以有效的提取全局上下文信息进行复杂的医学图像分割任务,本文的U-Transformer将多头Transformer中的模块引入UNet,通过两种注意力机制(多头自注意力和多头交叉注意力)来提取长程关系和空间依赖性。其网络结构如下图:

U-Net Transformer:用于医学图像分割的自我和交叉注意力模块

如图所示,多头注意力机制(MHSA)加在编码器最后,其感受野是整张图像1,而原始的UNet的感受野只是局部(蓝色区域),多头交叉注意机制用在解码器中的跳跃连接之后,主要将高层次语义更丰富的特征图谱与来自跳跃连接的高分辨率图结合起来。

Part-1自注意力机制

多头自注意力模块用于提取图像中的长程结构信息,因此本文在UNet做完编码器部分后在底部加入了多头注意力机制,这个多头注意力机制的主要作用是将特征图中的每个元素建立关联,对应的感受野是整个图像,因此当前像素点的分类取决于所有输入的像素,注意力的计算公式如下:

U-Net Transformer:用于医学图像分割的自我和交叉注意力模块

自注意力机制的计算涉及到了Q,K,V三个矩阵

MHSA模块

MHSA模块的具体计算过程如下图:

U-Net Transformer:用于医学图像分割的自我和交叉注意力模块

首先特征图+位置编码后reshape到一定的维度,Wq,Wk,Wv是训练的3个矩阵,通过这三个矩阵得到自注意力模块的计算结果,而Positional embedding对于医学图像分割十分重要,因为不同的组织结构分别在图像中不同的固定位置,加入Position信息之后就可以捕获器官之间的绝对信息和相对信息。

Q,K经过Softmax后的结果为注意力系数矩阵A,A乘以V得到最后的注意力输出。

MHCA模块

 交叉注意力负责将输入图像的每个像素之间建立关联,MHCA的核心思想就是想办法滤除跳跃连接中无关或噪声区域,突出显示相关区域。

其结构如下图所示:

U-Net Transformer:用于医学图像分割的自我和交叉注意力模块

MHCA的作用类似于一个门控函数,输入分别是跳跃连接过来的结果S和上一层的特征图Y处理后的结果。Y嵌入后的结果作为Q,K,S输入的结果作为V,最后跳跃连接的输出S是经过Y加权处理后的结果,计算出来的注意力权重会被rescale到0-1之间,最终交叉注意力的计算结果Z作为一个Fliter,再与S做点积,其中权值较小的元素代表噪声或者不相关的区域,可以被去除。经过这样处理的精简版的S,再将这一精简版的结果S再与Y做级联。

总结

本文提出的U-Transformer借助Transformer中的自注意力和交叉注意力有效的增加了UNet的性能,可以有效的捕获长程依赖关系,尤其对复杂器官或较小器官具有很好的分割性能。文章来源地址https://www.toymoban.com/news/detail-457321.html

到了这里,关于U-Net Transformer:用于医学图像分割的自我和交叉注意力模块的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 图像分割算法U-net

    @[TOC] UNet是一种用于图像分割任务的深度学习模型,最初由Olaf Ronneberger等人在2015年提出。它的名字来源于其U形状的网络结构。 UNet的主要特点是它使用了编码器和解码器结构,其中编码器部分由一系列卷积层和池化层组成,可以对输入图像进行特征提取和压缩。解码器部分则

    2024年01月23日
    浏览(39)
  • DeU-Net: 用于三维心脏mri视频分割的可变形(Deformable)U-Net

    论文链接:https://arxiv.org/abs/2007.06341 代码链接:文章都看完了实在找不到代码!好崩溃!好崩溃!已经发邮件联系作者! 心脏磁共振成像(MRI)的自动分割促进了临床应用中高效、准确的体积测量。然而,由于分辨率各向异性和边界模糊(如右心室心内膜),现有方法在心脏MRI三

    2024年02月09日
    浏览(44)
  • 基于U-Net网络实现图像分割

    黎长淼,男,西安工程大学电子信息学院,2022级研究生 研究方向:控制科学与工程 电子邮件:1043626870@qq.com 陈梦丹,女,西安工程大学电子信息学院,2022级硕士研究生,张宏伟人工智能课题组 研究方向:机器视觉与人工智能 电子邮件:1169738496@qq.com U-Net是2015年提出的一种

    2024年02月09日
    浏览(40)
  • 医学图像分割的全卷积transformer

    我们提出了一种新的Transformer ,能够分割不同模式的医学图像。医学图像分析的细粒度特性所带来的挑战意味着Transformer 对其分析的适应仍处于初级阶段。UNet的巨大成功在于它能够理解分割任务的细粒度性质,这是现有的基于变压器的模型目前所不具备的能力。为了解决这个

    2024年02月12日
    浏览(46)
  • LViT:语言与视觉Transformer在医学图像分割

    论文链接:https://arxiv.org/abs/2206.14718 代码链接:GitHub - HUANGLIZI/LViT: This repo is the official implementation of \\\"LViT: Language meets Vision Transformer in Medical Image Segmentation\\\" (IEEE Transactions on Medical Imaging/TMI) 深度学习在医学图像分割等方面得到了广泛的应用。然而,现有医学图像分割模型的性能

    2024年02月14日
    浏览(38)
  • 【图像处理】经营您的第一个U-Net以进行图像分割

            AI厨师们,今天您将学习如何准备计算机视觉中最重要的食谱之一:U-Net。本文将叙述:1 语义与实例分割,2 图像分割中还使用了其他损失,例如Jaccard损失,焦点损失;3 如果2D图像分割对您来说太容易了,您可以查看3D图像分割,因为模型要大得多,因此要困难得

    2024年02月15日
    浏览(56)
  • 【论文阅读】通过3D和2D网络的交叉示教实现稀疏标注的3D医学图像分割(CVPR2023)

    论文:3D Medical Image Segmentation with Sparse Annotation via Cross-Teaching between 3D and 2D Networks 代码:https://github.com/hengcai-nju/3d2dct 问题1 :医学图像分割通常需要大量且精确标注的数据集。但是获取像素级标注是一项劳动密集型的任务,需要领域专家付出巨大的努力,这使得在实际临床场

    2024年02月05日
    浏览(65)
  • 文献学习-30-GRAB-Net: 用于医学点云分割的图的边界感知网络

    GRAB-Net: Graph-Based Boundary-Aware Network for Medical Point Cloud Segmentation Authors: Yifan Liu, Wuyang Li, Jie Liu, Hui Chen, and Yixuan Yuan, Member, IEEE Keywords:  Point cloud segmentation, graph-based framework, boundary-aware segmentation. Abstract 点云分割在许多医学应用中都是基础性的,例如动脉瘤夹闭和矫正手术规划。最

    2024年04月11日
    浏览(40)
  • 医学图像分割:U_Net 论文阅读

    “U-Net: Convolutional Networks for Biomedical Image Segmentation” 是一篇由Olaf Ronneberger, Philipp Fischer, 和 Thomas Brox发表的论文,于2015年在MICCAI的医学图像计算和计算机辅助干预会议上提出。这篇论文介绍了一种新型的卷积神经网络架构——U-Net,特别是为了处理医学图像分割问题而设计。

    2024年02月04日
    浏览(49)
  • 论文阅读笔记——A2FSeg:用于医学图像分割自适应多模态融合网络

    论文地址: https://www.semanticscholar.org/paper/A2FSeg%3A-Adaptive-Multi-modal-Fusion-Network-for-Wang-Hong/330f94e291a9b881ad14ca500f8d96e185d43b15 代码仓库: https://github.com/Zirui0623/A2FSeg/tree/main?tab=readme-ov-file 磁共振成像(MRI)在多模式脑肿瘤分割中发挥着重要作用。然而,缺失模态在临床诊断中非常常

    2024年03月13日
    浏览(76)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包