丰富上下文的超高分辨率分割:一种新的基准

这篇具有很好参考价值的文章主要介绍了丰富上下文的超高分辨率分割:一种新的基准。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

Ultra-High Resolution Segmentation with Ultra-Rich Context: A Novel Benchmark

摘要

数据
随着人们对超高分辨率(UHR)分割方法的兴趣不断增加和快速发展,迫切需要一个覆盖广泛场景并具有全细粒度密集注释的大规模基准来促进该领域的发展。为此,引入了URUR数据集,即具有超丰富上下文的超高分辨率数据集。顾名思义,URUR包含大量分辨率足够高的图像(3008张5120×5120大小的图像)、广泛的复杂场景(来自63个城市)、足够丰富的上下文(100万个实例,8个类别)和细粒度注释(约800亿个手动注释像素),这远远优于包括DeepGlobe、Inria Aerial、UDD,
模型

  1. 还提出了WSDNet,这是一种更高效、更有效的UHR分割框架,尤其是在超丰富上下文的情况下,
  2. 多级离散小波变换(DWT)自然地被集成以释放计算负担,同时保留更多的空间细节,以及小波平滑损失(WSL)以利用平滑约束重建原始结构化上下文和纹理。
    代码地址
    丰富上下文的超高分辨率分割:一种新的基准

数据集

在数量、上下文丰富度和注释质量方面,所提出的URUR数据集远远优于所有现有的UHR数据集,包括DeepGlobe、Inria Aerial、UDD等。在本节中,我们将说明数据集构建的过程,并通过各种信息统计对其进行分析,并给出保护隐私的详细措施。

Dataset Summary

所提出的URUR数据集包含3008张来自63个城市的5012×5012大小的UHR图像。训练、验证和测试集分别包括2157张、280张和571张UHR图像,近似比例为7:1:2。所有图像都用细粒度的像素级类别进行了详尽的手动注释,包括“建筑”、“农田”、“温室”、“林地”、“荒地”、“水”、“道路”和“其他”8类。

Data Collection and Pre-processing

该数据集由几个高质量的卫星图像数据源收集,供公众使用。这产生了来自63个城市的数据,然后我们根据以下标准在每个城市手动选择大约20个场景:
低歧义:所选场景中的对象在外观上不应该有太多明显的语义歧义。
高度多样性:具有不同类别、实例、时间和天气的场景在我们的任务中应该更合适、更有意义。
隐私保护:场景中的任何信息都不应泄露任何有关隐私的信息,如个人、店铺名称等。
因此,数据集在相机视点、照明和场景类型方面有很大的变化。此外,为了增强数据集的多样性和丰富性,为每个场景设置并收集了多个粒度视角。结果,我们总共收集了752张大小为10240×10240的图像,然后将其划分为3008张大小为5120×5120的图像。

数据标注

与自然图像相比,注释UHR图像总是一项更艰巨的工作,因为要标记的对象随着图像分辨率的增加而呈二次增长。这就是为什么现有的UHR数据集通常利用粗粒度注释或只注释一个主要类别。相反,我们打算对所提出的URUR数据集中的整个类别采用更细粒度的注释。图1显示了直观的比较,有关数据集统计的更多细节将在第3.4节中介绍。可以看出,包括DeepGlobe、Inria Aerial和URUR在内的UHR数据集显然比Pascal VOC和COCO等自然数据集包含更多的对象和实例,而这些对象的规模也较小。此外,一个或多个类对经常在空间上混合在一起,这给在注释过程中仔细区分它们带来了很大的麻烦。相比之下,URUR还包含比其他UHR数据集更多的对象和更丰富的上下文。总之,注释细粒度超高分辨率图像的主要挑战和耗时部分不仅反映在过度超高的图像分辨率导致的待注释对象数量上,还反映在尺度急剧变化的对象之间的超丰富的图像上下文导致的许多链问题上。
为了高效准确地进行标注,首先将每个5120×5120的原始UHR图像均匀地裁剪成1000×1000的多个补丁。我们让注释器分别对这些图像块进行注释,然后对它们的结果进行相应的合并,以获得相对于原始UHR图像的最终注释。通过这种方式,我们确保每个注释器只关注较小的图像补丁,这有助于注释过程并提高注释结果的准确性。
在裁剪过程中,相邻的面片具有120×1000像素的重叠区域,以保证注释结果的一致性,避免边界消失。为了进一步节省人力并加快整个过程,使用早期手动注释的图像来训练ISDNet模型,并用于在剩余图像上生成分割掩模。作为参考,注释器在我们开发的注释工具的帮助下调整掩码。

数据统计

丰富上下文的超高分辨率分割:一种新的基准

表1显示了所提出的URUR数据集与现有的几个主要UHR数据集之间的详细统计比较,包括DeepGlobe[4]、Inria Aerial[5]、ISIC[5]、ERM-PAIM[37]、UDD[6]和UA Vid[7]。首先,对于最基本的图像统计,URUR由3008张大小为5120×5120的图像组成,在图像数量和分辨率方面都优于所有其他数据集。具体来说,除ISIC和DeepGlobe外,其他所有数据集的图像数量都在200以下。DeepGlobe包含803张图像,但分辨率仅为2448×2448(5.9M),甚至没有达到UHR介质的最小阈值(8.3M)(如第1节所示)。

WSDNet

丰富上下文的超高分辨率分割:一种新的基准
WSDNet:
由深分支D(下分支)和浅分支S(上分支)组成
在S中,使用拉普拉斯金字塔将输入图像分解为两个子带,然后将其连接并馈送到浅层网络中,以提取全尺寸的空间细节
在D中,使用两级离散小波变换(DWT)对输入图像进行下采样,然后将其输入到深度网络中,以获取高级类别上下文。
接下来,利用两级反相离散小波变换(IWT)将原始输入的尺度为1/32的输出上采样到1/8。最后,将这两个分支与多尺度特征融合,并使用基本交叉熵损失Lseg、辅助损失Laux以及小波平滑损失(WSL)进行优化,以在超分辨率头的帮助下重建原始输入。点线内的模块在推理过程中被移除。
小波平滑损失函数:
丰富上下文的超高分辨率分割:一种新的基准
总损失
丰富上下文的超高分辨率分割:一种新的基准

实验结果

丰富上下文的超高分辨率分割:一种新的基准
丰富上下文的超高分辨率分割:一种新的基准
丰富上下文的超高分辨率分割:一种新的基准文章来源地址https://www.toymoban.com/news/detail-491277.html

到了这里,关于丰富上下文的超高分辨率分割:一种新的基准的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 〖大前端 - 基础入门三大核心之JS篇(51)〗- 面向对象之认识上下文与上下文规则

    说明:该文属于 大前端全栈架构白宝书专栏, 目前阶段免费 , 如需要项目实战或者是体系化资源,文末名片加V! 作者:哈哥撩编程,十余年工作经验, 从事过全栈研发、产品经理等工作,目前在公司担任研发部门CTO。 荣誉: 2022年度博客之星Top4、2023年度超级个体得主、谷

    2024年02月05日
    浏览(58)
  • js执行上下文

    创造执行上下文,是为了把变量声明给保存下来,在执行时,好找到变量用 看代码要分执行前(构建执行上下文)和执行时去看 执行上下文的组成 1、词法环境:[全局对象]、scope、outer 2、This Binding:提供this的访问 构建执行上下文 1、处理声明 2、检查重复定义 3、初步赋值

    2024年02月02日
    浏览(55)
  • 执行上下文

    通过var定义(声明)的变量--在定义语句之前就可以访问到 值为undefined 通过function声明的函数--在之前就可以直接调用 值为函数定义(对象) 全局代码 函数(局部)代码 在执行全局代码前将window确定为全局执行上下文 对全局数据进行预处理 var定义的全局变量--undefined--添加

    2023年04月20日
    浏览(53)
  • Servlet 上下文参数

    2024年02月05日
    浏览(54)
  • CPU上下文切换

    CPU 上下文切换,就是先把前一个任务的 CPU 上下文(也就是 CPU 寄存器和程序计数器)保存起来,然后加载新任务的上下文到这些寄存器和程序计数器,最后再跳转到程序计数器所指的新位置,运行新任务。 CPU 的上下文切换就可以分为几个不同的场景,也就是进程上下文切换、

    2024年02月14日
    浏览(35)
  • 上下文切换性能篇

    现代操作系统都是多任务的分时操作系统,也就是说同时响应多个用户交互或同时支持多个任务处理,因为 CPU 的速度很快而用户交互的频率相比会低得多。所以例如在 Linux 中,可以支持远大于 CPU 数量的任务同时执行,对于单个 CPU 来说,其实任务并不是在同时执行,而是操

    2024年02月15日
    浏览(52)
  • 【Spring | 应用上下文】

      本节介绍如何使用资源创建应用程序上下文,包括使用 XML 的快捷方式、如何使用通配符以及其他详细信息。   应用上下文构造函数(针对特定的应用上下文类型)通常将字符串或字符串数组作为资源的位置路径,例如构成上下文定义的 XML 文件。 示例如下    Clas

    2024年02月16日
    浏览(38)
  • Flask 上下文是什么 ?

    哈喽大家好,我是咸鱼。今天我们来聊聊什么是 Flask 上下文   咸鱼在刚接触到这个概念的时候脑子里蹦出的第一个词是 CPU 上下文   今天咸鱼希望通过这篇文章,让大家能够对 Flask 上下文设计的初衷以及应用有一个基本的了解   我们在使用 Flask 开发 web 程序的时候,通常会

    2023年04月20日
    浏览(55)
  • Django --上下文处理器

    Django 的上下文处理器是一些函数,它们将变量添加到每个 Django 模板的上下文中,从而使模板可以访问这些变量。它们是在 Django 模板渲染过程中调用的,通常是在视图函数中返回渲染模板时调用的。 上下文处理器可以包含在 Django 项目中的任何应用程序中,并且可以在设置

    2024年02月05日
    浏览(38)
  • Kubernetes context 上下文配置

    如果您使用多个 Kubernetes 集群,当您从一个集群切换到另一个集群时,管理这样的配置文件很快就会变得很麻烦。 如果你的集群有多个命名空间,就会出现另一个痛点:每次使用kubectl时都需要指定–namespace或-n。结合多个集群,每个kubectl命令看起来都类似于 kubectl --namespac

    2024年02月13日
    浏览(37)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包