OpenMMLab-AI实战营第二期——5-1.语义分割与MMSegmentation

这篇具有很好参考价值的文章主要介绍了OpenMMLab-AI实战营第二期——5-1.语义分割与MMSegmentation。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

  • 视频链接:语义分割与MMSegmentation
  • 好的教程:超详细!手把手带你轻松用 MMSegmentation 跑语义分割数据集
  • 以及:超详细!带你轻松掌握 MMSegmentation 整体构建流程
  • 案例代码:https://github.com/TommyZihao/MMSegmentation_Tutorials

1. 基本概念

1.1 案例演示

OpenMMLab-AI实战营第二期——5-1.语义分割与MMSegmentation

OpenMMLab-AI实战营第二期——5-1.语义分割与MMSegmentation

OpenMMLab-AI实战营第二期——5-1.语义分割与MMSegmentation

OpenMMLab-AI实战营第二期——5-1.语义分割与MMSegmentation

1.2 应用

OpenMMLab-AI实战营第二期——5-1.语义分割与MMSegmentation

OpenMMLab-AI实战营第二期——5-1.语义分割与MMSegmentation

OpenMMLab-AI实战营第二期——5-1.语义分割与MMSegmentation

1.3 语义分割概念

OpenMMLab-AI实战营第二期——5-1.语义分割与MMSegmentation
OpenMMLab-AI实战营第二期——5-1.语义分割与MMSegmentation

2. 语义分割算法

2.1 语义分割基本思路

2.1.1 按颜色

OpenMMLab-AI实战营第二期——5-1.语义分割与MMSegmentation

最简单的思路:按照颜色聚类,基于同一物体颜色具有连续性这个先验知识

  • 大部分情况下,都可以分割(实现抠图)
  • 但是没有语义,就无法对同类物体做合并或者归为一类
    • 比如上图有个电线杆,马路就被分成了两部分。
    • 同时需要额外手段确定物体类别
  • 另外所基于的先验知识不完全准确,不同物体颜色可能接近,物体内也会包含多种颜色

2.1.2 逐像素分类

OpenMMLab-AI实战营第二期——5-1.语义分割与MMSegmentation
最早的CNN是用于分类问题的,分割任务可以作为逐像素分类的任务对待,基于滑窗逐点分类。

  • 优势:充分利用现有的图像分类模型
  • 问题:效率低下,重叠区域重复计算卷积。。。
    • 这个问题不是密集检测解决了吗。。。😂

OpenMMLab-AI实战营第二期——5-1.语义分割与MMSegmentation
复用卷积计算:对于同样的卷积核,在滑窗上计算卷积,和直接在原图上计算卷积,计算结果是相同的。

这部分就是目标检测里rcnn→fast rcnn→faster rcnn的思路

OpenMMLab-AI实战营第二期——5-1.语义分割与MMSegmentation
虽然复用卷积解决重复卷积计算的问题,但是还有个输入尺寸固定的问题

  • 传统的卷积神经网络里有全连接层,这就需要输入的特征图尺寸是固定的,进一步需要让输入的尺寸是固定的(输入网络的尺寸是固定的,原图如果size不合适需要进行resize等操作使之符合输入网络的尺寸)
  • 但是我们希望分割的图像是任意大小的尺寸,这就导致特征图大小也不固定,就无法使用全连接层进行分类

OpenMMLab-AI实战营第二期——5-1.语义分割与MMSegmentation

可以使用全连接层的卷积化来解决输入尺寸不固定的问题

2.2 深度学习下的语义分割模型

2.2.1 全卷积网络

OpenMMLab-AI实战营第二期——5-1.语义分割与MMSegmentation
这里的问题在于:卷积神经网络逐层降采样,导致特征图的空间分辨率比原图要小很多,无法和原图对齐。

所以需要有一些上采样的办法
OpenMMLab-AI实战营第二期——5-1.语义分割与MMSegmentation

OpenMMLab-AI实战营第二期——5-1.语义分割与MMSegmentation
OpenMMLab-AI实战营第二期——5-1.语义分割与MMSegmentation
可以用一个卷积核模拟双线性插值的效果,此时就是一个固定的卷积核,实现了上采样的效果。

OpenMMLab-AI实战营第二期——5-1.语义分割与MMSegmentation
如果不模拟双线性插值,而是直接给出一个需要去学习的卷积核,让它完成上采样的任务,这就是转置卷积

OpenMMLab-AI实战营第二期——5-1.语义分割与MMSegmentation

OpenMMLab-AI实战营第二期——5-1.语义分割与MMSegmentation

OpenMMLab-AI实战营第二期——5-1.语义分割与MMSegmentation
结合高层和低层特征图,mmdetection里FPN特征金字塔(2016年),以及mmpose里HRNet(2019年)。套路一直是一样的。。。

OpenMMLab-AI实战营第二期——5-1.语义分割与MMSegmentation

2.2.2 Unet

OpenMMLab-AI实战营第二期——5-1.语义分割与MMSegmentation

2.2.3 上下文信息与PSPNet模型

上面Unet和FCN都是用了上下层的信息(高层语义和低层细节互补,高层+低层特征)。
另外还有使用上下文信息的

OpenMMLab-AI实战营第二期——5-1.语义分割与MMSegmentation

OpenMMLab-AI实战营第二期——5-1.语义分割与MMSegmentation

OpenMMLab-AI实战营第二期——5-1.语义分割与MMSegmentation

利用上下文信息来改善分割效果,也是分割网络进化的一个思路。

  • 可能扩大感受野,使得在局部预测中包含上下文信息

OpenMMLab-AI实战营第二期——5-1.语义分割与MMSegmentation

多尺度池化,就对应不同尺度的感受野

2.2.4 空洞卷积与DeepLab算法

OpenMMLab-AI实战营第二期——5-1.语义分割与MMSegmentation
多尺度的空洞卷积ASPP模块就是多尺度池化+空洞卷积

OpenMMLab-AI实战营第二期——5-1.语义分割与MMSegmentation

OpenMMLab-AI实战营第二期——5-1.语义分割与MMSegmentation

OpenMMLab-AI实战营第二期——5-1.语义分割与MMSegmentation

OpenMMLab-AI实战营第二期——5-1.语义分割与MMSegmentation

OpenMMLab-AI实战营第二期——5-1.语义分割与MMSegmentation

OpenMMLab-AI实战营第二期——5-1.语义分割与MMSegmentation
OpenMMLab-AI实战营第二期——5-1.语义分割与MMSegmentation
OpenMMLab-AI实战营第二期——5-1.语义分割与MMSegmentation

OpenMMLab-AI实战营第二期——5-1.语义分割与MMSegmentation

OpenMMLab-AI实战营第二期——5-1.语义分割与MMSegmentation

2.2.5 总结

OpenMMLab-AI实战营第二期——5-1.语义分割与MMSegmentation

2.2.6 前言语义分割算法

OpenMMLab-AI实战营第二期——5-1.语义分割与MMSegmentation
Transformer系列

OpenMMLab-AI实战营第二期——5-1.语义分割与MMSegmentation
统一语义分割、实例分割和全景分割任务,大一统模型
OpenMMLab-AI实战营第二期——5-1.语义分割与MMSegmentation

OpenMMLab-AI实战营第二期——5-1.语义分割与MMSegmentation

以上几种比较前沿的新算法,MMSegmentation里都有实现
OpenMMLab-AI实战营第二期——5-1.语义分割与MMSegmentation
LabelStudio和LabelMe都集成了SAM,可以试试标注效果

参考:

  • cvat VS label-studio
  • Data Labeling Software: Best Tools for Data Labeling

2.3分割模型的评估方法

OpenMMLab-AI实战营第二期——5-1.语义分割与MMSegmentation

OpenMMLab-AI实战营第二期——5-1.语义分割与MMSegmentation

3. MMSegmentation

  • Github链接:https://github.com/open-mmlab/mmsegmentation/blob/main/README_zh-CN.md
  • 文档:https://mmsegmentation.readthedocs.io/zh_CN/latest/index.html

3.1 支持的数据集

参考:超详细!手把手带你轻松用 MMSegmentation 跑语义分割数据集
OpenMMLab-AI实战营第二期——5-1.语义分割与MMSegmentation
下载和将它重新组织成 MMSegmentaion 可以运行的格式的脚本,可以看看

  • mmsegmentation/docs/en/user_guides/2_dataset_prepare.md,
  • 或者中文文档:mmsegmentation/docs/zh_cn/dataset_prepare.md

已支持的数据集

  • Cityscapes:自动驾驶数据集,详见:图像分割cityscape数据集使用介绍,值得一读!
  • PASCAL VOC:常规自然场景的语义分割
  • ADE20K:有2万张图片150种目标的场景数据集,详见:ADE20K数据集
  • Pascal Context: 是PASCAL VOC 2010 检测挑战的扩展,详见:语义分割的数据集
  • COCO-Stuff 10k、COCO-Stuff 164k
  • CHASE_DB1:视网膜血管分割数据集,详见:Chasedb1–视网膜血管分割数据集
  • DRIVE:用于视网膜病变研究的数据集,详见:视网膜血管图像数据集DRIVE简介
  • HRF:视网膜血管分割数据集,详见:HRF 视网膜血管分割数据集
  • STARE:视网膜数据集
  • Dark Zurich:自动驾驶数据集(有GPS数据),详见:Dark Zurich 语义分割数据集
    OpenMMLab-AI实战营第二期——5-1.语义分割与MMSegmentation
  • Nighttime Driving:道路场景数据集,由 35,000 张图像组成。详见:Nighttime Driving
  • LoveDA:遥感语义分割(农村和城市的土地覆盖),详见:Junjue-Wang/LoveDA

快搜完了发现已经有文章整理过了。。。🥲🥲🥲文章来源地址https://www.toymoban.com/news/detail-486863.html

到了这里,关于OpenMMLab-AI实战营第二期——5-1.语义分割与MMSegmentation的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • AI实战营第二期 第七节 《语义分割与MMSegmentation》——笔记8

    MMSegmentation 是一个基于 PyTorch 的语义分割开源工具箱。它是 OpenMMLab 项目的一部分。 main 分支代码目前支持 PyTorch 1.6 以上的版本。 代码链接:https://gitee.com/open-mmlab/mmsegmentation 统一的基准平台。我们将各种各样的语义分割算法集成到了一个统一的工具箱,进行基准测试。 模块

    2024年02月08日
    浏览(41)
  • 【OpenMMLab AI实战营第二期】目标检测与MMDetection

    目标检测的基本范式 划窗 使用卷积实现密集预测 锚框 多尺度检测与FPN 单阶段无锚框检测器选讲 RPN YOLO、SSD Focal Loss与RetinaNet FCOS YOLO系列选讲 什么是目标检测 目标检测:给定一张图片,用矩形框框出所有感兴趣物体同时预测物体类别 目标检测与图像分类区别 图像分类通常

    2024年02月08日
    浏览(56)
  • 【OpenMMLab】AI实战营第二期Day10:底层视觉与MMEditing

    本课程包含底层视觉和MMEditing两个部分。第一部分介绍图像超分、深度学习和网络训练的相关算法,第二部分介绍超像素卷积、无监督学习、卷积网络和空间注意机制,以及这些算法在视觉框架中的实践应用。 📷介绍计算机视觉里面一个重要的问题:图像超分辨率以及相关

    2024年02月09日
    浏览(42)
  • 计算机视觉框架OpenMMLab(七):语义分割实战

    👨‍💻 作者简介: 大数据专业硕士在读,CSDN人工智能领域博客专家,阿里云专家博主,专注大数据与人工智能知识分享。 公众号: GoAI的学习小屋,免费分享书籍、简历、导图等资料,更有交流群分享AI和大数据,加群方式公众号回复“加群”或➡️点击链接。 🎉 专栏推

    2024年02月02日
    浏览(51)
  • MMPose(openmmlab AI实战营二期第一节)

    链接:人体关键点检测与MMPose_哔哩哔哩_bilibili 赶了个进度,实际上没听到,一个方向被浓缩成50分钟是有点难度。后续有需要再回顾吧 人体姿态估计:识别人体关键点坐标。模式识别任务,难点是始终在变化。以关键点连线,2/3D中还原人体姿态。PoseC3D:基于人体姿态识别行

    2024年02月07日
    浏览(39)
  • AI实战营第二期 第十节 《MMagic 代码课》——笔记11

    MMagic (Multimodal Advanced, Generative, and Intelligent Creation) 是一个供专业人工智能研究人员和机器学习工程师去处理、编辑和生成图像与视频的开源 AIGC 工具箱。 MMagic 允许研究人员和工程师使用最先进的预训练模型,并且可以轻松训练和开发新的定制模型。 MMagic 支持各种基础生成

    2024年02月14日
    浏览(43)
  • AI实战营第二期 第六节 《MMDetection代码课》——笔记7

    MMDetection 是被广泛使用的检测工具箱,包括了目标检侧、实例分割、全景分割等多个通用检测方向,并支持了 75+ 个主流和前沿模型, 为用户提供超过 440+ 个预训练模型, 在学术研究和工业落地中拥有广泛应用。该恇架的主要特点为: 模块化设计。MMDetection 将检测框架解耦成不

    2024年02月08日
    浏览(53)
  • AI实战营第二期 第五节 《目标检测与MMDetection》——笔记6

    MMDetection 是一个基于 PyTorch 的目标检测开源工具箱。它是 OpenMMLab 项目的一部分。是目前应用最广的算法库 主分支代码目前支持 PyTorch 1.6 以上的版本。代码链接:https://gitee.com/open-mmlab/mmdetection。 模块化设计。MMDetection 将检测框架解耦成不同的模块组件,通过组合不同的模块

    2024年02月08日
    浏览(38)
  • AI实战营第二期 第九节 《底层视觉与MMEditing》——笔记10

    本节内容 : 图像超分辨率 Super Resolution 基于卷积网络的模型 SRCNN 与 FSRCNN 损失函数 对抗生成网络 GAN 简介 基于 GAN 的模型 SRGAN 与 ESRGAN 视频超分辨率介绍 实践 MMEditing 1 图像超分辨率 : 根据从低分辨率图像重构高分辨率图像 。 将图像放大,变清晰 提高图像的分辨率 高分图像

    2024年02月09日
    浏览(36)
  • AI实战营第二期——第一次作业:基于RTMPose的耳朵穴位关键点检测

    根据中医的“倒置胎儿”学说,耳朵的穴位反映了人体全身脏器的健康,耳穴按摩可以缓解失眠多梦、内分泌失调等疾病。耳朵面积较小,但穴位密集,涉及耳舟、耳轮、三角窝、耳甲艇、对耳轮等三维轮廓,普通人难以精准定位耳朵穴位。 Labelme标注关键点检测数据集(子

    2024年02月08日
    浏览(45)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包