【计算机视觉 | 语义分割】干货：语义分割常见算法介绍合集（一）

7月前作者：旅途中的宽~ 分类：Toy博客阅读(49) 违法举报

这篇具有很好参考价值的文章主要介绍了【计算机视觉 | 语义分割】干货：语义分割常见算法介绍合集（一）。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

一、U-Net

U-Net 是一种语义分割架构。它由收缩路径和扩张路径组成。收缩路径遵循卷积网络的典型架构。它由两个 3x3 卷积（未填充卷积）的重复应用组成，每个卷积后跟一个修正线性单元 (ReLU) 和一个步长为 2 的 2x2 最大池化操作，用于下采样。在每个下采样步骤中，我们将特征通道的数量加倍。扩展路径中的每一步都包含对特征图进行上采样，然后进行 2x2 卷积（“上卷积”），将特征通道数量减半，与收缩路径中相应裁剪的特征图进行串联，以及两个 3x3 卷积，每个卷积后跟一个 ReLU。由于每次卷积都会丢失边界像素，因此需要进行裁剪。在最后一层，使用 1x1 卷积将每个 64 分量特征向量映射到所需数量的类。该网络总共有 23 个卷积层。

语义分割算法,语义分割算法介绍合集,计算机视觉,算法,人工智能,语义分割

二、Fully Convolutional Network

全卷积网络（FCN）是一种主要用于语义分割的架构。它们仅采用局部连接层，例如卷积、池化和上采样。避免使用密集层意味着更少的参数（使网络训练速度更快）。这也意味着 FCN 可以处理可变的图像尺寸，因为所有连接都是本地的。

该网络由用于提取和解释上下文的下采样路径和允许本地化的上采样路径组成。

FCN 还采用跳跃连接来恢复在下采样路径中丢失的细粒度空间信息。

语义分割算法,语义分割算法介绍合集,计算机视觉,算法,人工智能,语义分割

三、SegNet

SegNet 是一种语义分割模型。该核心可训练分割架构由编码器网络、相应的解码器网络和像素级分类层组成。编码器网络的架构在拓扑上与 VGG16 网络中的 13 个卷积层相同。解码器网络的作用是将低分辨率编码器特征图映射到全输入分辨率特征图以进行像素级分类。 SegNet 的新颖之处在于解码器对其较低分辨率输入特征图进行上采样的方式。具体来说，解码器使用在相应编码器的最大池步骤中计算的池索引来执行非线性上采样。

语义分割算法,语义分割算法介绍合集,计算机视觉,算法,人工智能,语义分割

四、DeepLab

DeepLab 是一种语义分割架构。首先，输入图像使用扩张卷积通过网络。然后对网络的输出进行双线性插值，并通过全连接的CRF对结果进行微调，得到最终的预测。

语义分割算法,语义分割算法介绍合集,计算机视觉,算法,人工智能,语义分割

五、DeepLabv3

DeepLabv3 是一种语义分割架构，它在 DeepLabv2 的基础上进行了一些修改。为了处理多尺度的对象分割问题，设计了采用级联或并行的空洞卷积的模块，通过采用多种空洞率来捕获多尺度上下文。此外，DeepLabv2 的 Atrous Spatial Pyramid Pooling 模块增强了编码全局上下文的图像级特征，并进一步提高了性能。

ASSP 模块的变化是，作者在模型的最后一个特征图上应用全局平均池化，将生成的图像级特征输入到具有 256 个滤波器（和批量归一化）的 1 × 1 卷积，然后对特征到所需的空间维度。最后，改进的 ASPP 由 (a) 一个 1×1 卷积和三个 3 × 3 卷积组成，当输出步长 = 16 时，速率 = (6, 12, 18)（全部具有 256 个滤波器和批量归一化），以及 ( b) 图像级特征。

另一个有趣的区别是不再需要 DeepLabv2 的 DenseCRF 后处理。

语义分割算法,语义分割算法介绍合集,计算机视觉,算法,人工智能,语义分割

六、UNet++

UNet++是一种基于U-Net的语义分割架构。通过使用密集连接的嵌套解码器子网络，它增强了提取的特征处理，据作者报道，它在电子显微镜 (EM)、细胞、细胞核、脑肿瘤、肝脏和肺结节医学图像分割方面优于 U-Net 任务。

语义分割算法,语义分割算法介绍合集,计算机视觉,算法,人工智能,语义分割

七、PSPNet

PSPNet（即金字塔场景解析网络）是一种语义分割模型，它利用金字塔解析模块，通过基于不同区域的上下文聚合来利用全局上下文信息。局部和全局线索共同使最终的预测更加可靠。我们还提出了一个优化方案

给定输入图像，PSPNet 使用预训练的 CNN 和扩张网络策略来提取特征图。最终的特征图大小为
1/8 输入图像的。在地图顶部，我们使用金字塔池模块来收集上下文信息。使用我们的 4 级金字塔，池化内核覆盖图像的整个、一半和一小部分。它们被融合为全局先验。然后我们在最后部分将先验与原始特征图连接起来。接下来是卷积层以生成最终的预测图。

语义分割算法,语义分割算法介绍合集,计算机视觉,算法,人工智能,语义分割

八、EfficientDet

EfficientDet 是一种对象检测模型，它利用多种优化和主干调整，例如使用 BiFPN，以及统一缩放所有主干、特征网络和框/类预测的分辨率、深度和宽度的复合缩放方法同时网络。

语义分割算法,语义分割算法介绍合集,计算机视觉,算法,人工智能,语义分割

九、SegFormer

SegFormer 是一个基于 Transformer 的语义分割框架，它将 Transformer 与轻量级多层感知器 (MLP) 解码器结合在一起。 SegFormer 有两个吸引人的功能：1）SegFormer 包含一个新颖的分层结构 Transformer 编码器，可输出多尺度特征。它不需要位置编码，从而避免了位置代码的插值，当测试分辨率与训练分辨率不同时，位置代码的插值会导致性能下降。 2）SegFormer避免了复杂的解码器。所提出的 MLP 解码器聚合来自不同层的信息，从而结合局部注意力和全局注意力来呈现强大的表示。

语义分割算法,语义分割算法介绍合集,计算机视觉,算法,人工智能,语义分割

十、ENet

ENet 是一种语义分割架构，采用紧凑的编码器-解码器架构。一些设计选择包括：

使用 SegNet 方法对 y 进行下采样，保存最大池化层中选择的元素索引，并使用它们在解码器中生成稀疏上采样映射。
早期下采样可优化网络的早期阶段并降低处理大型输入帧的成本。 ENet 的前两个块大大减少了输入大小，并且仅使用一小组特征图。
使用 PReLU 作为激活函数
使用扩张卷积
使用空间丢失

语义分割算法,语义分割算法介绍合集,计算机视觉,算法,人工智能,语义分割文章来源地址https://www.toymoban.com/news/detail-855396.html

到了这里，关于【计算机视觉 | 语义分割】干货：语义分割常见算法介绍合集（一）的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

计算机视觉与深度学习-图像分割-视觉识别任务01-语义分割-【北邮鲁鹏】

给每个像素分配类别标签。不区分实例，只考虑像素类别。滑动窗口缺点重叠区域的特征反复被计算，效率很低。所以针对该问题提出了新的解决方案–全卷积。让整个网络只包含卷积层，一次性输出所有像素的类别预测。全卷积优点不用将图片分为一个个小区域然后再

2024年02月07日
浏览(82)
计算机视觉三大基本任务：分类、检测（定位）、分割（语义和实例）

刚刚接触计算机视觉时可能会对不同的任务的区分以及网络架构的选择产生迷惑，因此，在此总结了相关的基础知识。在本文中，我们试图回答两个问题：不同任务要做的事情是什么，研究范畴是什么？不同的任务需要选择什么类型的网络？计算机视觉任务可以分为4大

2024年02月05日
浏览(64)
深度学习应用篇-计算机视觉-语义分割综述[5]：FCN、SegNet、Deeplab等分割算法、常用二维三维半立体数据集汇总、前景展望等

【深度学习入门到进阶】必看系列，含激活函数、优化策略、损失函数、模型调优、归一化算法、卷积模型、序列模型、预训练模型、对抗神经网络等专栏详细介绍：【深度学习入门到进阶】必看系列，含激活函数、优化策略、损失函数、模型调优、归一化算法、卷积模型、

2024年02月16日
浏览(57)
【计算机视觉】干货分享：Segmentation model PyTorch（快速搭建图像分割网络）

如何快速搭建图像分割网络？要手写把backbone ，手写decoder 吗？介绍一个分割神器，分分钟搭建一个分割网络。仓库的地址：该库的主要特点是：高级 API（只需两行即可创建神经网络）用于二元和多类分割的 9 种模型架构（包括传奇的 Unet） 124 个可用编码器（以及 timm

2024年02月14日
浏览(45)
【计算机视觉】CVPR 2023 上的分割论文真的是神仙打架（介绍前12篇，图像分割，全景分割，语义分割，实例分割）

AutoFocusFormer：网格外的图像分割论文地址：真实世界的图像通常具有高度不平衡的内容密度。有些区域非常均匀，例如大片蓝天，而其他区域则散布着许多小物体。然而，卷积深度网络中常用的连续网格下采样策略平等对待所有区域。因此，小对象在很少的空间位置表示

2024年02月12日
浏览(51)
深度学习实战23(进阶版)-语义分割实战，实现人物图像抠图的效果（计算机视觉）

大家好，我是微学AI，今天给大家带来深度学习实战23(进阶版)-语义分割实战，实现人物图像抠图的效果。语义分割是计算机视觉中的一项重要任务，其目标是将图像中的每个像素都分配一个语义类别标签。与传统的目标检测或分类任务不同，语义分割不仅需要识别图像中存在

2024年02月13日
浏览(58)
【计算机视觉 | 语义分割】OVSeg：分割一切后，SAM又能分辨类别了，Meta/UTAustin提出全新开放类分割模型

前几日，Meta 推出了「分割一切」AI 模型 Segment Anything，令网友直呼 CV 不存在了？！而在另一篇被 CVPR 2023 收录的论文中，Meta、UTAustin 联合提出了新的开放语言风格模型（open-vocabulary segmentation, OVSeg），它能让 Segment Anything 模型知道所要分隔的类别。论文地址：从效果上来看

2024年02月12日
浏览(59)
计算机视觉：聚类算法(K-Means)实现图像分割

什么是K-means聚类？ K-means聚类是一种无监督学习算法，用于将一组数据划分为K个不同的类别或簇。它基于数据点之间的相似性度量，将数据点分配到最接近的聚类中心。K-means算法的目标是最小化数据点与其所属聚类中心之间的平方距离和。 K-means聚类在图像分割中的应用在

2024年02月02日
浏览(39)
OpenCV处理图像和计算机视觉任务时常见的算法和功能

当涉及到OpenCV处理图像和计算机视觉任务时，有许多常见的具体算法和功能。以下是一些更具体的细分：图像处理算法：图像去噪：包括均值去噪、高斯去噪、中值滤波等，用于减少图像中的噪声。直方图均衡化：用于增强图像的对比度，特别适用于低对比度图像。边缘

2024年02月11日
浏览(43)
【计算机视觉 | 图像分割】arxiv 计算机视觉关于图像分割的学术速递（7 月 6 日论文合集）

面向跨域语义分割的提示扩散表示法虽然最初设计用于图像生成，扩散模型最近已证明提供了优秀的预训练的特征表示语义分割。这一结果引起了兴趣，我们开始探索扩散预训练表示如何推广到新的领域，这是任何表示的关键能力。我们发现，扩散预训练实现了非凡的领域泛

2024年02月12日
浏览(58)