OneFormer:规则通用图像分割的一个Transformer

这篇具有很好参考价值的文章主要介绍了OneFormer:规则通用图像分割的一个Transformer。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

OneFormer: One Transformer to Rule Universal Image Segmentation

摘要

通用图像分割并不是一个新概念。过去统一图像分割的尝试包括场景解析、全景分割,以及最近的新全景架构。然而,这种全景架构并不能真正统一图像分割,因为它们需要在语义、实例或全景分割上单独训练,以获得最佳性能。理想情况下,一个真正通用的框架应该只训练一次,并在所有三个图像分割任务中实现SOTA性能。
本文方法

  1. 提出了OneFormer,这是一种通用的图像分割框架,将分割与多任务一次训练设计相结合。
  2. 首先提出了一种任务条件联合训练策略,该策略能够在单个多任务训练过程中对每个领域的标签(语义、实例和全景分割)进行训练。
  3. 其次,引入了一个他task token来将我们的模型以手头的任务为条件,使我们的模型任务是动态的,以支持多任务训练和推理。
  4. 第三,我们建议在训练过程中使用查询文本对比损失来建立更好的任务间和类间区分。
    代码地址
    OneFormer:规则通用图像分割的一个Transformer

本文方法

OneFormer:规则通用图像分割的一个Transformer
OneFormer框架架构:
(a) 我们使用主干网络提取输入图像的多尺度特征,然后使用像素解码器。
(b) 我们在任务令牌(Qtask)的指导下,在变换器内部建立了一组统一的N−1任务条件对象查询和平坦的1/4尺度特征
接下来,我们将Qtask和来自transformer的N-1个查询连接起来。
我们在训练期间对任务进行统一(p=1/3)采样,并使用文本映射器生成相应的文本查询(Qtext)。
我们计算一个查询文本对比损失来学习任务间的区别。我们可以在推理过程中丢弃文本映射器,从而使我们的模型参数高效。
(c) 我们使用多级L层transformer解码器来获得任务动态类和掩码预测
OneFormer:规则通用图像分割的一个Transformer
输入文本格式
(a) 我们在训练中统一对任务进行抽样
(b) 我们从对应的GT标签中提取每个类的不同二进制掩码的数量
(c) 我们使用模板“带有{CLS}的照片”为每个掩码形成一个包含文本描述的列表,其中CLS表示对象掩码的相应类名
(d) 最后,我们使用表示无对象检测的“a/an{task}photo”条目将文本列表填充为恒定长度的Ntext;其中task∈{panoptic, instance, semantic}。

OneFormer:规则通用图像分割的一个Transformer
Text Mapper:我们使用6层transformer文本编码器对输入文本列表(Tpad)进行 tokenize化,然后对其进行编码,以获得一组Ntext嵌入。我们将一组Nctx可学习嵌入连接到编码的表示,以获得最终的N个文本查询(Qtext)。N个文本查询代表图像中存在的对象的基于文本的表示。
详情可以看原论文

实验结果

OneFormer:规则通用图像分割的一个Transformer
OneFormer:规则通用图像分割的一个Transformer文章来源地址https://www.toymoban.com/news/detail-485974.html

到了这里,关于OneFormer:规则通用图像分割的一个Transformer的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【图像处理】经营您的第一个U-Net以进行图像分割

            AI厨师们,今天您将学习如何准备计算机视觉中最重要的食谱之一:U-Net。本文将叙述:1 语义与实例分割,2 图像分割中还使用了其他损失,例如Jaccard损失,焦点损失;3 如果2D图像分割对您来说太容易了,您可以查看3D图像分割,因为模型要大得多,因此要困难得

    2024年02月15日
    浏览(43)
  • GIT版本号命名通用规则,开源项目版本号通用规则

    该规则对版本的迭代顺序命名做了很好的规范,其版本号的格式为 X.Y.Z(又称为Major.Minor.Patch) ,递增的规则为: 序号 格式要求 说明 X 非负整数 表示主版本号(Major),当API的兼容性变化时,X需递增。 Y 非负整数 表示次版本号(Minor),当增加功能时(不影响API)的兼容性

    2024年02月07日
    浏览(27)
  • Segment Anything论文翻译,SAM模型,SAM论文,SAM论文翻译;一个用于图像分割的新任务、模型和数据集;SA-1B数据集

    论文链接: https://arxiv.org/pdf/2304.02643.pdf https://ai.facebook.com/research/publications/segment-anything/ 代码连接:https://github.com/facebookresearch/segment-anything 论文翻译: http://t.csdn.cn/nnqs8 https://blog.csdn.net/leiduifan6944/article/details/130080159 本文提出Segment Anything (SA)项目:一个用于图像分割的新任务

    2023年04月19日
    浏览(34)
  • 在Winform应用中增加通用的业务编码规则生成

    在我们很多应用系统中,往往都需要根据实际情况生成一些编码规则,如订单号、入库单号、出库单号、退货单号等等,我们有时候根据规则自行增加一个函数来生成处理,不过我们仔细观察后,发现它们的编码规则有很大的共通性,因此可以考虑使用一些通用的业务编码规

    2024年02月05日
    浏览(26)
  • 【深度学习实战(6)】搭建通用的语义分割推理流程

    无论输入的图片尺寸多大,都会经过letter_box后,变为512x512尺寸 21个channel代表(20+1)个类别,512x512为模型输入及输入尺寸 经过softmax后,512x512的mask图中,每个位置(x,y)对应的21个channel的值和为1。 pr类型是np,array,所以可以通过这种方式进行逆letter_box操作,将mask的宽高,还原

    2024年04月16日
    浏览(29)
  • 图像处理技术:数字图像分割 ------ 图像分割、边界分割(边缘检测)、区域分割

    是指根据灰度、彩色、空间纹理、几何形状等特征把图像划分 成若干个互不相交的区域,使得这些特征在同一区域内表现出一致 性或相似性,而在不同区域间表现出明显的不同 分割出来的区域应该同时满足:  (1)分割出来的图像区域的均匀性和连通性。 • 均匀性是指该

    2024年02月04日
    浏览(36)
  • 图神经网络:(图像分割)三维网格图像分割

    文章说明: 1)参考资料:PYG的文档。文档超链。斯坦福大学的机器学习课程。课程超链。(要挂梯子)。博客原文。原文超链。(要挂梯子)。原文理论参考文献。提取码8848。 2)我在百度网盘上传这篇文章的jupyter notebook以及预训练模型。提取码8848. 3)博主水平不高,如有错误,还

    2024年02月13日
    浏览(29)
  • 图神经网络:(图像分割)3D人物图像分割

    文章说明: 1)参考资料:PYG的文档。文档超链。斯坦福大学的机器学习课程。课程超链。(要挂梯子)。博客原文。原文超链。(要挂梯子)。原文理论参考文献。提取码8848。 2)我在百度网盘上传这篇文章的jupyter notebook以及预训练模型。提取码8848. 3)博主水平不高,如有错误,还

    2024年02月12日
    浏览(39)
  • Matlab|图像处理04|图像分割-阈值分割方法

    一、人工阈值分割方法threshold_test1.m 1、分析修改阈值对分割结果的影响 分析:取直方图中第一个谷底的灰度值作为阈值,图像分割效果较好。当阈值改变时,分割后的图像有部分信息丢失,本图中当阈值减小时分割后的图像黑色部分较多,当阈值增大时分割后的图像白色部

    2024年02月11日
    浏览(31)
  • 数字图像处理:图像分割——边缘检测与区域分割

    1.图像分割:根据图像的某些局部特征(灰度级、纹理、彩色或统计特征等)的相似性和互斥性,将图像分割成若干子区域,在每个子区域内部具有相似(相同或相近)特性,而相邻子区域的特性互斥。所以图像分割是利用图像局部特征的相似性和互斥性。 2.图像分割方法分

    2024年02月05日
    浏览(30)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包