医学影像系统弱监督语义分割集成的探索

这篇具有很好参考价值的文章主要介绍了医学影像系统弱监督语义分割集成的探索。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

Exploring Weakly Supervised Semantic Segmentation Ensembles for Medical Imaging Systems

摘要

  • 利用复杂数据集的低质量CAM预测来提高结果的准确性
  • 使用低阈值CAMs以高确定性覆盖目标对象
  • 通过组合多个低阈值cam,在突出显示目标对象的同时均匀地消除它们的错误
    代码链接
    文章链接

本文方法

医学影像系统弱监督语义分割集成的探索
首先,在目标数据集上训练分类器模型(resnet)
其次,使用Grad-CAM为不同的分类器创建第一个掩码。
接下来,测试集成方法来组合两个或多个预测集。
最终,选择提供最佳可能结果的集合版本,然后进行校准步骤,以确定最高检测分数的最佳阈值集合。

分类器模型实例的训练与探索

该框架旨在创建不同CAM方法的集合,因为它们的集合抵消了它们的缺点,因此比它们的单一部分产生更准确的预测。最好的集合是由高质量的cam生成的,而高质量的cam是由高质量的分类器生成的,我们必须研究目标数据集的分类器。


本文的探索内容

我们没有努力测试更复杂的网络,而是从其他方法(如自我监督的Swav)中获得了一些灵感。Swav尝试在没有指导的情况下学习区分图片,而不是使用注释。为此,Swav使用对比损失函数来比较图像对。损失函数的目标是将特征空间中不同的图像推开,同时将特征空间中同一图像的转换或视图中的图像拉到一起。
本文作者对Swav方法的兴趣依赖于两个原因:首先,对医疗数据集使用预训练的无监督模型可能会提高Grad-CAM结果的质量。这可能是因为无监督模型更倾向于区分形状,而不仅仅是猜测正确的类别。其次,许多最先进的方法为分类损失增加了额外的正则化。那些正则化,例如SEAM中的仿射变换,与Swav的对比学习损失在很大程度上是相同的。因此,我们假设无监督训练模型的激活可以更完整地识别对象。本文已经评估了多个训练的Swav模型,但观察到与传统训练的分类器相比,它们的对比损失方法并没有产生更高质量的CAMs。


评估训练模型的grad - cam

在创建候选分类器之后,我们可以专注于生成CAM预测。为此,我们将应用grad - cam。梯度加权类激活映射(Grad-CAM)将网络和图像作为输入,并返回一个粗略的掩码。
然而,结果表明,如果图像中包含多个同一类的出现,Grad-CAM就不能正确地定位图像中的对象。此外,还发现由于不考虑偏导数的平均值,定位往往不对应于整个物体,而只对应于部分物体。因此,引入了grad - cam++ ,它通过使用更复杂的重要性分数公式来解决这些问题。作为进一步优化,引入了SmoothGrad-CAM++。
然而,这些改进旨在提高被检测对象边界的清晰度,并缓解原始方法在同一图像中有多个同类对象的问题。但是,这些问题在观察到的医学数据集中并没有发生。BraTS和DECATHLON数据集中的所有图像都不包含目标对象的多个实例。此外,这些目标物体通常是圆形的,即使对专家来说,其边界也是模糊的。尽管如此,我们也测试了smoothgrad - cam++,因为它是这种方法的最新版本。
对于CAM生成,将通过候选Grad-CAM运行我们训练过的候选模型和图像,为所有图像创建MASK

集成方法

医学影像系统弱监督语义分割集成的探索
收集了候选模型和grad - cam的mask,我们的目标是将它们结合起来以获得更高质量的结果。
首先,我们有“or”集合,它总结了候选区的预测。当两个mask都具有较高的真阳性率时,这种方法最有效,在组合mask之间产生最大的可能激活区域。第二种是“and”方法,将候选区的预测相乘。与“or”方法相比,“and”方法使两个掩模的可能检测区域最小化。当两个模型的真阴率都很高时,这种方法效果最好
“min”和“max”方法分别只采用最小或最大正分类像素的MASK
通过这种方式,解决了模型倾向于预测目标对象的大小过大或太小的问题,而一个候选对象的完整预测仍然比所有候选对象的“and”或“or”更好。
由于Grad-CAM方法以从0到1的形式返回预测,我们可以确定将像素视为正分类或负分类的值的阈值。这个超参数让我们对任何给定预测的假阳性和假阴性率都有很大的余地。使用非常高的阈值会大大减少被分类为阳性的区域,从而导致很高的假阴性率。反之亦然,使用非常低的阈值会极大地增加被分类为阳性的区域,从而导致高假阳性率。最优阈值因候选模型而异。因此,我们决定测试所选择的集成方法,使用从0到1的所有阈值组合,步长为0.1。我们在训练集上进行这些测试,以确定我们将在验证集上使用的阈值。我们的实验表明,训练集的最优阈值组合也是验证集的最优组合之一。

结果展示

医学影像系统弱监督语义分割集成的探索
医学影像系统弱监督语义分割集成的探索文章来源地址https://www.toymoban.com/news/detail-405908.html

到了这里,关于医学影像系统弱监督语义分割集成的探索的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 医院影像科PACS系统源码,医学影像系统,支持MPR、CPR、MIP、SSD、VR、VE三维图像处理

    PACS系统是医院影像科室中应用的一种系统,主要用于获取、传输、存档和处理医学影像。它通过各种接口,如模拟、DICOM和网络,以数字化的方式将各种医学影像,如核磁共振、CT扫描、超声波等保存起来,并在需要时能够快速调取和使用。 PACS系统还提供了辅助诊断和管理功

    2024年02月03日
    浏览(52)
  • 医学影像PACS系统源码: 三维重建基本后处理方法的介绍和说明

    多层面重建(MPR) 最大密度投影(MIP) 最小密度投影(MinIP) 表面阴影遮盖(SSD) 容积漫游技术(VRT) 曲面重建(CPR) 虚拟内镜技术(VE)   1、MPR MPR(Multi-Planar Reformatting),多平面重建,是将扫描范围内所有的轴位图像叠加起来再对某些标线标定的重组线所指定的组织进行

    2024年02月09日
    浏览(55)
  • 医学影像篇 医学图像预处理之重采样详细说明

    0 1 准备工作 研究前我们先要做好准备工作:(这个准备工作呢就好像小白做菜) 最开始,我们往往主动提出或者被提出了一个临床问题(临床问题可能是老板直接安排的,也可能是在临床工作中提出经过文献调研归纳的),根据提出的临床问题和手头现有的病例,可以建立

    2024年02月04日
    浏览(106)
  • C#处理医学影像(四):基于Stitcher算法拼接人体全景脊柱骨骼影像

    在拍摄脊柱或胸片时,经常会遇到因设备高度不够需要分段拍摄的情况, 对于影像科诊断查阅影像时希望将分段影像合并成一张影像,有助于更直观的观察病灶, 以下图为例的两个分段影像:       我们使用OpenCVSharp中的Stitcher类的Stitch方法,导入两张图像并拼接:  但结果

    2024年02月02日
    浏览(43)
  • C#开发PACS医学影像三维重建(一):使用VTK重建3D影像

    VTK简介:   VTK是一个开源的免费软件系统,主要用于三维计算机图形学、图像处理和可视化。Vtk是在面向对象原理的基础上设计和实现的,它的内核是用C++构建的。 因为使用C#语言开发,而VTK是C++的,所以推荐使用VTK的.Net开发库:ActiViz。 本系列文章主要以技术和代码讲解为

    2024年02月09日
    浏览(62)
  • 开源医学影像存档与检索系统(PACS)之Dcm4che-arc-light安装部署详细教程(适用于windows平台)

    Dcm4che-arc-light是一个开源的医学影像存档和通信系统(PACS)解决方案。它是基于Dcm4che项目的一个子项目,专注于实现轻量级而功能强大的医学影像存档与检索(ARCHIVE)功能。 Dcm4che-arc-light具备以下主要特点: 总而言之,Dcm4che-arc-light是一个功能强大且易于使用的医学影像存

    2024年02月04日
    浏览(58)
  • 人工智能与医学影像:智能诊断和治疗

    人工智能(AI)已经成为医学影像诊断和治疗的关键技术之一。随着数据量的增加,计算能力的提升以及算法的创新,AI 在医学影像分析领域的应用不断拓展。这篇文章将介绍人工智能如何应用于医学影像诊断和治疗,以及其背后的核心概念、算法原理和具体实例。 医学影像诊

    2024年02月19日
    浏览(48)
  • Transformer在医学影像中的应用综述-分类

    总体结构 Point-of-Care Transformer(POCFormer):利用Linformer将自注意的空间和时间复杂度从二次型降低到线性型。POCFormer有200万个参数,约为MobileNetv2的一半,因此适合于实时诊断。 Vision Outlooker (VOLO):新注意机制,将精细级特征编码为ViT token 表征,从而提高分类性能。 Swin Transfor

    2024年02月11日
    浏览(34)
  • Med-YOLO:3D + 医学影像 + 检测框架

      论文链接:https://arxiv.org/abs/2312.07729 代码链接:https://github.com/JDSobek/MedYOLO 提出背景 :人工智能已经应用于大量的医学影像的识别,但是还缺少通用的3D医学影像检测框架。 在中大尺寸结构(如心脏、肝脏和胰腺)上的性能非常高。 然而,模型在处理非常小或罕见的结构时

    2024年01月22日
    浏览(50)
  • 【医学影像数据处理】 XML 文件格式处理汇总

    xml(Extensible Markup Language,简称:XML) 可扩展标记语言,是一种 netconf 配置文件的格式。是一种固有的分层数据格式,最自然的表示方式是解析成树状。 但是, xml 这样的标签数据,是 面向“机器”识别的,是不利于“人类”识别的 ,所以看起来会比较的麻烦。 2003年5月成

    2024年02月08日
    浏览(44)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包