《VM-UNet: Vision Mamba UNet for Medical Image Segmentation》论文阅读及代码复现

这篇具有很好参考价值的文章主要介绍了《VM-UNet: Vision Mamba UNet for Medical Image Segmentation》论文阅读及代码复现。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

论文地址:[2402.02491] VM-UNet: Vision Mamba UNet for Medical Image Segmentation (arxiv.org)

代码地址:JCruan519/VM-UNet: (ARXIV24) This is the official code repository for "VM-UNet: Vision Mamba UNet for Medical Image Segmentation". (github.com)

摘要

在医学图像分割领域,基于细胞神经网络和基于变换器的模型都得到了广泛的探索。然而,细胞神经网络在长期建模能力方面表现出局限性,而变压器则受到其二次计算复杂性的阻碍。最近,以曼巴为例的状态空间模型(SSM)已成为一种很有前途的方法。它们不仅擅长对长程相互作用进行建模,而且保持线性计算复杂性。在本文中,利用状态空间模型,我们提出了一种用于医学图像分割的Ushape架构模型,称为Vision Mamba UNet(VM UNet)。具体地,引入视觉状态空间(VSS)块作为基础块来捕获广泛的上下文信息,并构建了一种不对称的编码器-解码器结构。我们在ISIC17、ISIC18和Synapse数据集上进行了全面的实验,结果表明,VM UNet在医学图像分割任务中具有竞争力。据我们所知,这是第一个基于纯SSM模型构建的医学图像分割模型。我们的目标是建立一个基线,并为未来开发更高效、更有效的基于SSM的分割系统提供有价值的见解。

技术现状

近年来,状态空间模型(State Space Models)引起了研究者的极大兴趣。在经典SSM研究的基础上,现代SSM(例如Mamba)不仅建立了长距离依赖关系,而且在输入大小方面表现出线性复杂性。此外,基于SSM的模型在许多领域得到了大量研究,包括语言理解、一般视觉等。特别是,U-Mamba最近推出了一种新的SSM-CNN混合模型,标志着它首次应用于医学图像分割任务。SegMamba在编码器部分结合了SSM,同时在解码器部分仍然使用CNN,这提出了用于3D脑肿瘤分割任务的SSM-CNN混合模型。尽管上述工作已经将SSM用于医学图像分割任务,但纯基于SSM的模型的性能仍有待探索。

文章贡献

1)提出了VM-UNet,这标志着首次探索了纯基于SSM的模型在医学图像分割中的潜在应用。

2) 在三个数据集上进行了综合实验,结果表明VM UNet表现出相当大的竞争力。

3) 在医学图像分割任务中为纯基于SSM的模型建立了基线,提供了有价值的见解,为开发更高效、更有效的基于SSM分割方法铺平了道路。

整体结构vm-unet:vision mamba unet for medical image segmentation,论文阅读

① Vision Mamba UNet (VM-UNet)

VM-UNet包括Patch Embedding layer, an encoder, a decoder, a Final Projection layer, and skip connections。采用了不对称结构设计。Patch Embedding layer将输入图像划分为4*4的不重叠补丁,随后将图像的维度映射到C(默认96),该过程得到嵌入图像H4×W/4×C,然后编码器的4个stage进行特征提取,前3个stage结束时应用补丁合并操作以减少输入特征的高度和宽度,同时增加通信数量。每个stage使用2个VSS块。解码器部分与编码器类似。

② VSS block

输入数据通过层归一化后,被拆分为两个分支。在第一个分支中,输入通过线性层和激活函数;第二个分支通过线性层、深度可分离卷积和激活函数、2D选择性扫描模块2D-Selective-Scan(SS2D)。随后进行层归一化,与第一个分支的输出执行逐元素生成。最后进行一个残差连接操作得到VSS block的输出。结构中的损失函数选择的SiLU

SS2D由3部分组成,a scan expanding operation, an S6 block, and a scan merging operation

scan expanding operation将输入图像沿着四个不同的方向(从左上到右下、从右下到左上、从右上到左下、从左下到右上)展开为序列。然后S6块对这些序列进行处理,以进行特征提取,确保对来自各个方向的信息进行彻底的扫描,从而获取不同的特征。随后,合并序列,将输入图像恢复到与输入相同的大小。vm-unet:vision mamba unet for medical image segmentation,论文阅读

S6块源自Mamba,通过根据输入调整SSM的参数,在S4之上引入了一种选择性机制。这使得模型能够区分和保留相关信息,同时过滤掉不相关的信息。算法1中给出了S6块的伪代码vm-unet:vision mamba unet for medical image segmentation,论文阅读

结论

vm-unet:vision mamba unet for medical image segmentation,论文阅读vm-unet:vision mamba unet for medical image segmentation,论文阅读

在本文中,我们首次引入了一种纯的基于SSM的医学图像分割模型,将VM-UNet作为基线。为了利用基于SSM的模型的能力,我们使用VSS块构建VM UNet,并使用预训练的VMamba-S初始化其权重。在皮肤损伤和多器官分割数据集上进行的综合实验表明,纯基于SSM模型在医学图像分割任务中具有很强的竞争力,值得在未来进行深入探索。

代码复现

注意目前只支持linux系统复现

conda create -n vmunet python=3.8
conda activate vmunet
pip install torch==1.13.0 torchvision==0.14.0 torchaudio==0.13.0 --extra-index-url https://download.pytorch.org/whl/cu117
pip install packaging
pip install timm==0.4.12
pip install pytest chardet yacs termcolor
pip install submitit tensorboardX
pip install triton==2.0.0
pip install causal_conv1d==1.0.0  # causal_conv1d-1.0.0+cu118torch1.13cxx11abiFALSE-cp38-cp38-linux_x86_64.whl
pip install mamba_ssm==1.0.1  
# 如果安不上按下面步骤
# 点击报错中链接
# pip install mamba_ssm-1.0.1+cu118torch1.13cxx11abiFALSE-cp38-cp38-linux_x86_64.whl
pip install scikit-learn matplotlib thop h5py SimpleITK scikit-image medpy yacs
#预训练权重下载地址:https://pan.baidu.com/s/144nc45k28NBB_8k9hf_OeQ?pwd=xuns

vm-unet:vision mamba unet for medical image segmentation,论文阅读文章来源地址https://www.toymoban.com/news/detail-842959.html

到了这里,关于《VM-UNet: Vision Mamba UNet for Medical Image Segmentation》论文阅读及代码复现的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • FCT: The Fully Convolutional Transformer for Medical Image Segmentation 论文解读

    论文:The Fully Convolutional Transformer for Medical Image Segmentation (thecvf.com) 代码:Thanos-DB/FullyConvolutionalTransformer (github.com) 期刊/会议:WACV 2023 我们提出了一种新的transformer,能够分割不同形态的医学图像。 医学图像分析的细粒度特性所带来的挑战意味着transformer对其分析的适应仍处

    2024年02月10日
    浏览(46)
  • 【论文阅读笔记】Prompt Tuning for Parameter-efficient Medical Image Segmentation

    Fischer M, Bartler A, Yang B. Prompt tuning for parameter-efficient medical image segmentation[J]. Medical Image Analysis, 2024, 91: 103024. 【开源】 【核心思想】 本文的核心思想是提出了一种用于医学图像分割的参数高效的提示调整(Prompt Tuning)方法。这种方法基于预训练的神经网络,通过插入可学习的

    2024年01月17日
    浏览(58)
  • 医学图像分割2 TransUnet:Transformers Make Strong Encoders for Medical Image Segmentation

    TransUnet:Transformers Make Strong Encoders for Medical Image Segmentation 在医学图像分割领域,U形结构的网络,尤其是Unet,已经取得了很优秀的效果。但是,CNN结构并不擅长建立远程信息连接,也就是CNN结构的感受野有限。尽管可以通过堆叠CNN结构、使用空洞卷积等方式增加感受野,但也

    2024年02月05日
    浏览(52)
  • HiFormer Hierarchical Multi-scale Representations Using Transformers for Medical Image Segmentation

    [WACV2023] HiFormer: Hierarchical Multi-scale Representations Using Transformers for Medical Image Segmentation 摘要 由于卷积神经网络的卷积运算的特性,它们在建模长程相关性和空间相关性时受到限制。虽然Transformer最初是为了解决这个问题而开发的,但它们 无法捕获低级别的特征 。相比之下,

    2024年01月21日
    浏览(58)
  • SA-Net:用于医学图像分割的尺度注意网络 A scale-attention network for medical image segmentation

            医学图像的语义分割为后续的图像分析和理解任务提供了重要的基石。随着深度学习方法的快速发展,传统的 U-Net 分割网络已在许多领域得到应用。基于探索性实验,已发现多尺度特征对于医学图像的分割非常重要。在本文中,我们提出了一种尺度注意力深度学

    2024年02月16日
    浏览(50)
  • 论文阅读——Loss odyssey in medical image segmentation

    Loss odyssey in medical image segmentation github:https://github.com/JunMa11/SegLossOdyssey 这篇文章回顾了医学图像分割中的20种不同的损失函数,旨在回答:对于医学图像分割任务,我们应该选择哪种损失函数? 首先是一张各类分割函数的图谱: 介绍函数之前先定义字母符号的含义: , 分别

    2024年02月04日
    浏览(50)
  • MedSegDiff: Medical Image Segmentation withDiffusion Probabilistic Model

    MedSegDiff:基于扩散概率模型的医学图像分割 摘要: 扩散概率模型(Diffusion probabilistic model, DPM) 是近年来计算机视觉研究的热点之一。它在Imagen、Latent Diffusion Models和Stable Diffusion等图像生成应用中表现出了令人印象深刻的生成能力,引起了社区的广泛讨论。最近的许多研究还发

    2024年02月02日
    浏览(39)
  • Medical Imaging AI – Image Segmentation using Deep Lear

    作者:禅与计算机程序设计艺术 Image segmentation is one of the key tasks in medical image analysis and computer vision that involves dividing an entire image into multiple parts or regions based on some criteria such as color, texture, shape, etc., so that each region represents a different object or structure present in the image. It helps to e

    2024年02月06日
    浏览(48)
  • 【论文阅读笔记】SegVol: Universal and Interactive Volumetric Medical Image Segmentation

    Du Y, Bai F, Huang T, et al. SegVol: Universal and Interactive Volumetric Medical Image Segmentation[J]. arXiv preprint arXiv:2311.13385, 2023.[代码开源] 【论文概述】 本文思路借鉴于自然图像分割领域的 SAM ,介绍了一种名为SegVol的先进医学图像分割模型,旨在构建一种 图像分割基础模型 ,这是一个面向体

    2024年01月16日
    浏览(48)
  • 3D医学图像分割大模型 SegVol: Universal and Interactive Volumetric Medical Image Segmentation

    pub: 22 November, 2023 ArXiv [ paper] [ code] 1 体积图像分割通过准确提取器官、病变和组织等感兴趣的区域,在医学图像分析中起着至关重要的作用,在肿瘤监测、手术计划、疾病诊断和优化治疗等临床应用中有着广泛的应用。 2 公开可用的体积医学图像数据集通常由来自不同类别的

    2024年02月03日
    浏览(54)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包