【论文阅读】通过3D和2D网络的交叉示教实现稀疏标注的3D医学图像分割(CVPR2023)

这篇具有很好参考价值的文章主要介绍了【论文阅读】通过3D和2D网络的交叉示教实现稀疏标注的3D医学图像分割(CVPR2023)。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

论文:3D Medical Image Segmentation with Sparse Annotation via Cross-Teaching between 3D and 2D Networks
代码:https://github.com/hengcai-nju/3d2dct

前言

问题1:医学图像分割通常需要大量且精确标注的数据集。但是获取像素级标注是一项劳动密集型的任务,需要领域专家付出巨大的努力,这使得在实际临床场景中获取具有挑战性。
可行的方向:稀疏的标注,与传统弱监督标记(比如边界框和乱码)相比具有若干优势,因为它保留了精确的表姐
问题2:监督信号稀缺性
解决方案:提出了使用3D和2D网络交叉教学的框架,鲁棒的从稀疏标注中学习。
具体怎么解决:生成伪标签来增加监督信号。
伪标签怎么生成:看后文
怎么知道生成的伪标签可不可用:伪标签选择
方法:提出两种伪标签选择策略,硬-软置信度阈值和一致标签融合
效果:在MMWHS dataset中优于SOTA的半监督学习方法,与全监督方法的上界相当。

方法

标注

考虑一个3D图像标注一个标签,它的限制:

  1. 目标必须在标注的切片上可见,如果多分类,大多数情况下目标很难都在一张图片中可见。
  2. 切片间可能变化大,单个切片的信息不足以训练一个性能很好的分割模型。
    要求:1. 目标可见 2. 标注的两个切片之间变化很大,才能获得更多信息。
    标注方法:十字标注法。Cross Annotation
    【论文阅读】通过3D和2D网络的交叉示教实现稀疏标注的3D医学图像分割(CVPR2023),论文阅读

3D-2D Cross Teaching

【论文阅读】通过3D和2D网络的交叉示教实现稀疏标注的3D医学图像分割(CVPR2023),论文阅读
(大家可以忽略,我在锻炼我提出问题的能力)只看这个图,可以提出很多问题:
M 2 D 1 M_{2D_1} M2D1, M 2 D 2 M_{2D_2} M2D2 M 3 D M_{3D} M3D一看就是模型,它们是什么结构,(2D的模型有一个切片标注了,可以用作半监督分割模型或者few-shot中的1-shot,不知道对不对),那么3D那个就是输出和伪标签比较计算loss吗。为什么3D输出的也能监督2D的。这两个怎么权衡?其中的 P a c c P_{acc} Pacc是什么为什么生成2个3D输出,MIX是什么操作?为什么MIX?可能那个2D的猜错了,它是2D和3D相互监督,只有两个Loss。
这个框架包含3个网络,一个3D网络,两个2D网络。 3D和2D网络之间的不同是内在的它们的结构决定的,两个2D网络的不同源自于它们在不同的平面的切片上训练网络。
3D样本直接作为3D网络的输入,在两个方向上切片得到横向切片和冠状切片作为2D网络的输入,它们的预测值为 P P P。选择之后作为伪标签。
为了增加监督信号,我们混合了选择的伪标签和稀疏的真是标签一起监督。
Y ^ = M I X ( Y , P ) \hat{Y}=MIX(Y,P) Y^=MIX(Y,P)
用稀疏的真实标签替换掉伪标签中相应的部分。
因为3D网络比2D网络强大,所以如果3D网络预测结果的置信度大于两个2D的伪标签,这个体素就不应该计算Loss。
使用M去表示体素对损失计算的贡献,如果第i个位置体素的损失不应该被计算就为0,其他对于真实标注就是1,对于伪标签是w,其中w是0-0.1的斜坡函数。
【论文阅读】通过3D和2D网络的交叉示教实现稀疏标注的3D医学图像分割(CVPR2023),论文阅读

伪标签选择

Hard-Soft Confidence Threshold

因为监督信号有限,所以3D网络预测得到的标签信号噪声大,直接用作2D网络的伪标签,会造成性能的退化。设置一个置信度去选择更有可能准确的体素。
问题:可能会过滤掉置信度低的正确的体素。
想法:如果知道预测的准确度,我们可以设置比准确度低一点的置信度来利用更多有用的体素信息。
问题:不知道3D网络预测和真是真实标签的准确度。
想法:使用伪标签的准确度利用稀疏标签和那一部分的预测值计算准确度。训练的时候实际准确度 R a c c R_{acc} Racc,伪标签的准确度 P a c c P_{acc} Pacc与训练样本是有关联的。
【论文阅读】通过3D和2D网络的交叉示教实现稀疏标注的3D医学图像分割(CVPR2023),论文阅读
I I I指示函数(是1否0),不太理解我以为是只计算标注的那两个图片上的。yi前面 Y ^ \hat{Y} Y^的元素, p ^ i \hat{p}_i p^i是对第i个体素的one-hot预测。
Soft置信度 t s t_s ts有较低的值,Hard置信度 t h t_h th有较高的值。对于可靠的预测置信度高,用Soft置信度选择伪标签,目的:保留置信度低的体素,筛选掉特别不确定的体素减少错误监督带来的影响。
在不可靠。在不可靠的预测中,只有置信度高于硬阈值的体素才能被选为伪标签。设置硬阈值是为了从不可靠的预测中选择高质量的体素。软硬置信度阈值策略实现了增加监控信号和降低标签噪声之间的平衡。

Consistent Prediction Fusion

用两个2D网络的输出的一致的部分作为3D网络的伪标签。
因为两个2D网络是在不同平面的切片上训练的,它们学习区分不同平面的前景和背景。两个网络输出一致的部分更有可能正确。

结论

在本文中,我们将稀疏注释扩展到交叉注释,以适应更一般的真实临床场景。
我们从两个平面标记切片,这扩大了注释的多样性。
为了更好地利用交叉注释,我们从半监督分割的角度来看待这个问题,我们提出了一种新的交叉教学范式,它对3D和2D网络的预测施加了一致性。
此外,为了实现鲁棒的交叉监督,我们提出了新的策略来选择可信的伪标签,是三维网络的软硬阈值和2D网络的一致预测融合。文章来源地址https://www.toymoban.com/news/detail-744850.html

到了这里,关于【论文阅读】通过3D和2D网络的交叉示教实现稀疏标注的3D医学图像分割(CVPR2023)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • [论文阅读]MV3D——用于自动驾驶的多视角3D目标检测网络

    Multi-View 3D Object Detection Network for Autonomous Driving 用于自动驾驶的多视角3D目标检测网络 论文网址:MV3D 这篇论文提出了一个多视角3D目标检测网络(MV3D),用于自动驾驶场景下高精度的3D目标检测。主要的创新点有: 提出了一种紧凑的多视角表示方法来编码稀疏的3D点云数据。该方法

    2024年02月08日
    浏览(32)
  • 【论文阅读】EULER:通过可扩展时间链接预测检测网络横向移动(NDSS-2022)

    作者:乔治华盛顿大学-Isaiah J. King、H. Howie Huang 引用:King I J, Huang H H. Euler: Detecting Network Lateral Movement via Scalable Temporal Graph Link Prediction [C]. Proceedings 2022 Network and Distributed System Security Symposium, 2022. 原文地址:https://dl.acm.org/doi/pdf/10.1145/3588771 源码地址:https://github.com/iHeartGrap

    2024年02月14日
    浏览(15)
  • XRSPACE 总经理刘冠廷:元宇宙行业如何通过 2D、3D 联动,实现高速用户增长?

    元宇宙领域创业并非坦途,似乎已经成为了行业共识。 即使到今天,VR/AR 领域的装备开支和上手学习成本居高不下,全球整体用户体量相比移动互联网也仍属早期阶段。 在这样的背景下,元宇宙公司如何持续且快速地获得用户增长,就成为各家管理者需要思考的难题。 其中

    2024年02月08日
    浏览(23)
  • RLE 稀疏水平集 RLE sparse level sets 论文阅读笔记

    原文: Houston, Ben, Mark Wiebe, and Chris Batty. “RLE sparse level sets.” ACM SIGGRAPH 2004 Sketches. 2004. 137. 只有一页,这就是技术草案的含金量吗 run-length encoded, RLE 游程编码 为什么 run-length 会被翻译为游程 我理解它把连续的重复出现的数字编码成 值+出现次数 的思想 但是还是理解不了这

    2024年02月22日
    浏览(24)
  • 论文阅读-Pegasus:通过网络内一致性目录容忍分布式存储中的偏斜工作负载

    论文名称: Pegasus: Tolerating Skewed Workloads in Distributed Storage with In-Network Coherence Directories 高性能分布式存储系统面临着由于偏斜和动态工作负载引起的负载不平衡的挑战。本文介绍了Pegasus,这是一个利用新一代 可编程交换机ASIC 来平衡存储服务器负载的新型存储系统。Pegasus使

    2024年02月20日
    浏览(37)
  • 【MLP-BEV(2)】LSS,2D->3D,Lift-Splat-Shoot:通过隐式反投影到3D空间实现对任意相机图像编码

    Lift-Splat-Shoot 很巧妙的利用 attention 的方式端到端地学了一个深度,但是因为没有显式的深度作为监督. 当前在BEV下进行感知方法大致分为两类,一类是以Transformer 为主体的隐式深度(Depth)信息进行转换的架构,另一类则是基于显示的深度估计投影到BEV下的方法,也就是本文

    2024年02月10日
    浏览(21)
  • VoxelNext,全稀疏的3D目标检测网络

    GitHub - dvlab-research/VoxelNeXt: VoxelNeXt: Fully Sparse VoxelNet for 3D Object Detection and Tracking (CVPR 2023) https://arxiv.org/abs/2303.11301 当前3D目标检测模型,在检测部分都是沿用2D的方法,在dense的特征图上,通过预设的anchor或者center来预测3D的框,本文的创新是利用点云的稀疏的特性,在通过s

    2024年02月09日
    浏览(15)
  • 图像融合论文阅读:CrossFuse: 一种基于交叉注意机制的红外与可见光图像融合方法

    @article{li2024crossfuse, title={CrossFuse: A novel cross attention mechanism based infrared and visible image fusion approach}, author={Li, Hui and Wu, Xiao-Jun}, journal={Information Fusion}, volume={103}, pages={102147}, year={2024}, publisher={Elsevier} } 论文级别:SCI A1 影响因子:18.6 📖[论文下载地址] 💽[代码下载地址] 以往的交

    2024年01月15日
    浏览(23)
  • OrienterNet: visual localization in 2D public maps with neural matching 论文阅读

    题目 :OrienterNet: visual localization in 2D public maps with neural matching 作者 :Paul-Edouard Sarlin, Daniel DeTone 项目地址 :github.com/facebookresearch/OrienterNet 来源 :CVPR 时间 :2023 人类可以使用简单的 2D 地图在 3D 环境中定位自己。不同的是,视觉定位算法主要依赖于复杂的 3D 点云,随着时

    2024年02月11日
    浏览(22)
  • VoxelNeXt:用于3D检测和跟踪的纯稀疏体素网络

    VoxelNeXt:Fully Sparse VoxelNet for 3D Object Detection and Tracking 目前自动驾驶场景的3D检测框架大多依赖于dense head,而3D点云数据本身是稀疏的,这无疑是一种低效和浪费计算量的做法。我们提出了一种纯稀疏的3D 检测框架 VoxelNeXt。该方法可以直接从sparse CNNs 的 backbone网络输出的预测

    2024年02月03日
    浏览(21)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包