UniverSeg:通用医学图像分割模型来了!

这篇具有很好参考价值的文章主要介绍了UniverSeg:通用医学图像分割模型来了!。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

自从今年以来ChatGPT爆火和GPT-4的发布,一时间在大模型的潮流下,通用人工智能(AGI)也呼之欲出。随着本月初SAM和SegGPT等通用的CV大模型的提出,大模型和通用模型这把火也逐渐烧到的CV领域,特别是图像分割领域。很多做分割方向的小伙伴自我调侃说一觉醒来,自己的方向没了。

笔者所在的医学影像行业,一直以数据和高成本标注而筑起非常高的领域壁垒。几个月前要是有人跟我说想做一个医学影像的通用分割模型,我一定会觉得你是在说胡话。但此一时彼一时也,月初SAM发布的时候,主要对标的自然图像,笔者也测试了其在医学影像上表现,效果可以说超出预期了,但远不如自然图像,这让笔者感到医学影像的领域壁垒要打破可能还早。

但打脸来得太快。昨天看到了MIT发布的UniverSeg工作,名字很直接,针对的就是医学影像的通用分割:UniverSeg: Universal Medical Image Segmentation。趁着今天周末在家,赶紧把论文打印出来认真读了一遍。 

UniverSeg:通用医学图像分割模型来了!

近几年深度学习图像分割一直是高度定制化的,而医学影像分割尤其如此,对于不同影像模态(CT、MR、超声、X-ray、OCT等)、不同身体部位、不同标注(同一影像,可能会有不同的目标对象)。笔者所在的行业和方向,做一个目标影像或者疾病的分割任务,一定是专门收集该任务的影像数据,然后找专业人员来标注,再训练一个定制化的分割模型,这个模型是高度垂直的、定制化的和难以迁移的。但现在SAM和UnvierSeg的出现打破了这一范式。如图2所示,区别于此前的训练-预测的分割范式,UniverSeg给出的分割范式是:输入查询图像(Query Image),即待分割图像,再给定若干对提示图像-标注对(Support Set),UniverSeg就可以对查询图像进行很好的分割。 

UniverSeg:通用医学图像分割模型来了!

数据

先来看数据部分。UniverSeg研究总共使用了53个开源或者半开源的医学影像数据集,总共包括26个医学领域、16种影像模态和22000多次扫描。因为聚焦的是2D医学图像分割,所以对来源数据集中属于3D volume的数据都做了层采样,包括中间层采样(mid-slices)和最多标签体素层采样(max-slices)。基于这53个数据集构建的新数据被命名为MegaMedical数据集。但因为各来源数据集的有限获取规则,所以作者也没有开源MegaMedical。训练集构成信息如图3所示。

UniverSeg:通用医学图像分割模型来了!

模型

模型部分是UniverSeg工作的重点部分。传统的分割任务范式针对数据集,目标是训练一个监督学习模型,其中即为常规的卷积分割网络。但UniverSeg给出的模型范式是:,其中表示给定任务的输入,即待分割的查询图像,表示为提示图像和标注对:。

UniverSeg针对以上分割任务范式,提出了一种交叉卷积构成的CrossBlock结构,能够在查询图像和提示图像之间进行信息交互。给定查询图像特征图和一组提示图像特征图,交叉卷积层可以定义为:

其中表示两个特征图的concatenation。基于上述交叉层,进一步地可搭建交叉模块为:

最终,基于交叉卷积模块构建出的UniverSeg网络结构如图3所示。同时,为了提高UniverSeg的性能,模型在训练的时候也都做了数据增强,包括In-Task和Task两种数据增强方案。UniverSeg的训练流程如下图所示。整体结构仍然是基于UNet的编解码架构,只是卷积层都用CrossConv模块来代替了。

UniverSeg:通用医学图像分割模型来了!

实验

实验部分主要是与一些少样本模型(SENet、ALPNet、PANet)做了基线对比,然后在任务多样性、提示数据规模、查询图像规模等方面做了消融研究。UniverSeg试验部分做得很扎实,附录里面给了很多维度的性能结果,笔者这里不做一一展示。

UniverSeg:通用医学图像分割模型来了!

UniverSeg:通用医学图像分割模型来了!

总结

UniverSeg的主要贡献包括:

  • 提出了基于CrossBlock交叉模块机制的UniverSeg作为新的医学图像分割范式,无需重新训练新分割模型。

  • 与以往的少样本模型相比,UniverSeg在未经训练的新影像上表现出了与监督分割模型相当的精度。

  • 训练时的样本多样性能够使得UniverSeg有着强大的泛化性能。

总体来讲,在数据壁垒极高和标注成本极大的医学图像领域,通用分割模型不在遥不可及。随着AGI和CV大模型的发展,UniverSeg以及后续研究会逐渐推进这一领域的发展。2D分割模型也会逐渐向2.5D和3D扩展和延伸。

代码

项目代码地址:https://github.com/JJGO/UniverSeg demo地址:https://colab.research.google.com/drive/19Sauvhyzae5qvVLguaZRCuH1vJ5oTuw-?usp=sharing


另外,为了聚集更多的人参与到AI生产力工具上来,笔者前几天特意组建了一个名为【ChatGPT实验室】的知识星球,目前已有170+读者加入,星球的主要定位包括:

1. 如何基于ChatGPT提高工作和学习效率。

2. 跟踪NLP、LLM、AIGC和AGI的前沿动态和最新进展。

3. 分享ChatGPT的最新应用和玩法。文章来源地址https://www.toymoban.com/news/detail-475248.html

到了这里,关于UniverSeg:通用医学图像分割模型来了!的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 3D医学图像分割大模型 SegVol: Universal and Interactive Volumetric Medical Image Segmentation

    pub: 22 November, 2023 ArXiv [ paper] [ code] 1 体积图像分割通过准确提取器官、病变和组织等感兴趣的区域,在医学图像分析中起着至关重要的作用,在肿瘤监测、手术计划、疾病诊断和优化治疗等临床应用中有着广泛的应用。 2 公开可用的体积医学图像数据集通常由来自不同类别的

    2024年02月03日
    浏览(39)
  • Python Unet ++ :医学图像分割,医学细胞分割,Unet医学图像处理,语义分割

    一,语义分割:分割领域前几年的发展 图像分割是机器视觉任务的一个重要基础任务,在图像分析、自动驾驶、视频监控等方面都有很重要的作用。图像分割可以被看成一个分类任务,需要给每个像素进行分类,所以就比图像分类任务更加复杂。此处主要介绍 Deep Learning-ba

    2024年02月16日
    浏览(38)
  • 【论文速览】图像分割领域的通用大模型SegGPT - Segmenting Everything in Context

    代码地址:https://github.com/baaivision/Painter Demo地址:https://huggingface.co/spaces/BAAI/SegGPT 图像分割 一直是计算机视觉领域的一项基础研究问题,在深度学习时代得到了迅猛发展,对于不同的分割子问题,涌现了很多又快又好的算法。但这些方法都是针对具体的子任务进行设计的,比

    2024年02月07日
    浏览(33)
  • 【医学图像】图像分割系列.2 (diffusion)

    介绍几篇使用diffusion来实现医学图像分割的论文:DARL(ICLR2023),MedSegDiff(MIDL2023) MedSegDiff-V2(arXiv2023),ImgX-DiffSeg(arXiv2023) 基础概念: 一文弄懂 Diffusion Model (qq.com)。 表示学习(representation learning)初印象 - 知乎 (zhihu.com)。 10分钟快速入门PyTorch (10) - 知乎 (zhihu.com)。 解读

    2024年02月07日
    浏览(28)
  • 医学图像分割

    方法 内容 监督学习 骨干网络的选择、网络块的设计、损失函数的改进 弱监督学习 数据增强、迁移学习、交互式分割研究 医学图像分割的难点: 医学图像的特征提取,因为医学影像中存在模糊、噪声、对比度低等问题。–CNN 医学图像通常含有噪声且边界模糊。–U-Net 目标

    2024年02月04日
    浏览(28)
  • 医学图像分割之MedNeXt

    论文: MedNeXt: Transformer-driven Scaling of ConvNets for Medical Image Segmentation ConvNeXt 网络是一种借鉴 Transformer 的思想进行了改进实现的全卷积网络,其通过全卷积网络和逆向残差瓶颈单元的设计,可以实现比较大的空间感受野。本文在此基础上提出了新的可伸缩,标准化的网络结构

    2023年04月08日
    浏览(42)
  • 深度学习实验-3d医学图像分割

    实验四 基于nnU-Net模型的3D医学图像分割实验 腹部多器官分割一直是医学图像分析领域最活跃的研究领域之一,其作为一项基础技术,在支持疾病诊断,治疗规划等计算机辅助技术发挥着重要作用。近年来,基于深度学习的方法在该领域中获得了巨大成功。本实验数据集为多

    2024年02月07日
    浏览(40)
  • 医学图像分割常用的评价指标

        在医学图像分割的论文中,常常看到Dice、VOE、RVD、MSD等指标,但是具体这些指标是什么意思呢,我们进行相应的简单说明。 V s e g text V_{s e g} V s e g ​ :代表预测的分割结果 V g t text V_{g t} V g t ​ :代表ground truth的分割结果     Dice 系数是一种评估相似度的函

    2024年02月08日
    浏览(25)
  • 医学图像的图像处理、分割、分类和定位-1

            本报告全面探讨了应用于医学图像的图像处理和分类技术。开展了四项不同的任务来展示这些方法的多功能性和有效性。任务 1 涉及读取、写入和显示 PNG、JPG 和 DICOM 图像。任务 2 涉及基于定向变化的多类图像分类。此外,我们在任务 3 中包括了胸部 X 光图像的性

    2024年01月19日
    浏览(70)
  • 医学图像分割的全卷积transformer

    我们提出了一种新的Transformer ,能够分割不同模式的医学图像。医学图像分析的细粒度特性所带来的挑战意味着Transformer 对其分析的适应仍处于初级阶段。UNet的巨大成功在于它能够理解分割任务的细粒度性质,这是现有的基于变压器的模型目前所不具备的能力。为了解决这个

    2024年02月12日
    浏览(29)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包