语义分割学习篇

9月前作者：harry trolor 分类：Toy博客阅读(33) 违法举报

这篇具有很好参考价值的文章主要介绍了语义分割学习篇。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

part1 什么是语义分割？

语义分割使图像分类任务的一种，实际上是对图片中每个像素进行分类，将相同类别的像素聚在一起从而呈现出分割的效果。

主要应用于无人驾驶（以像素粒度感知周围环境）与医疗影像领域（以像素粒度定位病灶区域）

语义分割过程,学习,人工智能,计算机视觉

当物体存在遮挡时，语义分割会将整体分割，而实例分割则会对相互遮挡的物体进行区分。全景分割一般应用在无人驾驶的图像分割中。

part2 语义分割思路方法

早期思路：基于先验，按照颜色进行分割（先验知识不完全准确）

现在思路：基于卷积神经网络

语义分割过程,学习,人工智能,计算机视觉

滑动窗口：用不同尺寸大小的滑动窗口在图像上滑动，以某像素为中心的窗口区域看作一张图片，输入卷积神经网络，每一次滑动进行一次分类（效率太低）

改进方法：与之前一样的卷积，但是直接将整张图片进行卷积，再通过滑动窗输入网络进行分类

语义分割过程,学习,人工智能,计算机视觉

新的问题：进行分类的最后一层全连接层，要求有固定的输入大小。

之前是先分割原图，卷积得到尺寸相同的小图像特征图，再输入全连接层得到类别。

现在是先将原图输入卷积层得到特征图，直接输入全连接层得到全图上的类别。而不同的原图对应的卷积后的特征图尺寸是不同的。

解决办法：全连接层的卷积化

语义分割过程,学习,人工智能,计算机视觉

举个例子：卷积后的特征图为256*14*14，分类任务有3个类别，全连接层即有3个神经元，每个神经元对特征图256个通道，14*14大小都有固定的权重。那么就可以把全连接层中的每个神经元看作做一个卷积核（图片第二行这里特征图大小与卷积核大小是一致的，最后1*1*3表示这张图在三个类别中的概率）。所以对更大的尺寸不一的原图，输入全连接层就相当于对特征图做了三层卷积。得到F*F*3，就是F*F个位置上的类别，再通过滑动窗分割出F*F个位置的类别

全连接层具体内容参考这篇博主讲的很好：http://t.csdn.cn/V2hMX

这就是下面说的全卷积网络的两大改进之一

part3 经典语义分割模型

（1）全卷积网络（Fully Convolution Network 2015）

改进一：全连接层卷积化

将分类网络转化为语义分割网络，同时兼容任意大小的输入

语义分割过程,学习,人工智能,计算机视觉

改进二：预测图的上采样

保证输出预测图大小与原图大小一致

语义分割过程,学习,人工智能,计算机视觉

① 双线性插值（无可学习参数，word里面的放大缩小）

语义分割过程,学习,人工智能,计算机视觉

② 转置卷积 (有可学习的参数)

双线性插值的卷积核是定义好的，而转置卷积的卷积核是可学习的

语义分割过程,学习,人工智能,计算机视觉

语义分割过程,学习,人工智能,计算机视觉

全卷积网络的过程：

语义分割过程,学习,人工智能,计算机视觉

下采样进行图像分类，再升采样得到与原图大小一致的预测图，与实际的分割图进行逐像素的交叉熵损失函数求损失并求和，作为语义分割的损失，进行反向传播迭代优化网络的可学习参数，如卷积核权重，转置卷积权重，使得损失函数最小化

新的问题：卷积神经网络逐层下采样使得特征图越来越小，使得分割图越来越小。分割精度越来越低，丢失空间信息。（高层特征经过多次采样，细节丢失严重）

解决思路：结合低层次与高层次特征图（低层次的细节与高层次的语义信息）

语义分割过程,学习,人工智能,计算机视觉

低层与高层结合经典的网络是UNet

语义分割过程,学习,人工智能,计算机视觉

（2）上下文信息与PSPNet（2016）

上下文往往可以帮我们做出更准群的判断，比如床上的枕头，在床上放置能够判断出是枕头。而滑动窗口丢失了上下文信息

存在问题：需要有足够大的感受野帮助我们获取上下文信息，但传统分类网络其感受野受到主干网络的结构限制

解决思路：增加感受野更大的网络分支，将上下文信息导入局部的预测中。

语义分割过程,学习,人工智能,计算机视觉

（3）DeepLab

语义分割过程,学习,人工智能,计算机视觉

①空洞卷积解决下采样问题

由于下采样会丢失空间信息，希望能够保留特征图的长宽 → 减少下采样的次数 → 于是去掉卷积层和池化层中步长大于1的层 → 于是特征图就会变大，但是为了保证卷积核在原图中的感受野相同 → 于是要增加对应的卷积核，维持相同的感受野 → 增加了大量参数

空洞卷积：在不增加参数的情况下增大感受野

下采样加标准卷积等价于空洞卷积

语义分割过程,学习,人工智能,计算机视觉

语义分割过程,学习,人工智能,计算机视觉

只有原图1/4是因为进行了下采样，调整膨胀倍率即可调整感受野大小

语义分割过程,学习,人工智能,计算机视觉

②条件随机场 Conditional Random Filed ，CRF

条件随机场是对原始网络的结果进行后处理，得到更加精细化的结果

语义分割过程,学习,人工智能,计算机视觉

语义分割过程,学习,人工智能,计算机视觉

语义分割过程,学习,人工智能,计算机视觉

③空间金字塔池化 Atrous Spatial Pyramid Pooling ，ASPP

PSPNet中使用不同尺度的池化获取不同尺度上的上下文信息

DeepLab v2&v3 使用不同尺度的空洞卷积达到类似的效果

更大的膨胀率的空洞卷积，对应更大的感受野，也就能获取更多的上下文信息

语义分割过程,学习,人工智能,计算机视觉

DeepLab v3+ 语义分割过程,学习,人工智能,计算机视觉

模型方法总结部分：

语义分割过程,学习,人工智能,计算机视觉

part4 语义分割模型评估

语义分割过程,学习,人工智能,计算机视觉

语义分割过程,学习,人工智能,计算机视觉文章来源地址https://www.toymoban.com/news/detail-656815.html

到了这里，关于语义分割学习篇的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

毕业设计：基于机器学习的硬币检测识别系统人工智能 YOLO 计算机视觉

目录前言课题背景和意义实现技术思路一、硬币检测方法 1.1 规格、变形监测 1.2 变色检测二、数据集三、实验及结果分析 3.1 实验环境搭建 3.2 模型训练最后 📅大四是整个大学期间最忙碌的时光,一边要忙着备考或实习为毕业后面临的就业升学做准备,一边要为

2024年02月20日
浏览(83)
第九课：机器学习与人工智能、计算机视觉、自然语言处理 NLP及机器人

各位小伙伴想要博客相关资料的话关注公众号：chuanyeTry即可领取相关资料！以区分飞蛾为例：标记数据如下。虚线为决策边界如下。右下角表为混淆矩阵。本质上是用任意线段来切分决策空间，不一定是直线。不用统计学的算法。模拟人类学习的过程，将数据进行加权求

2024年02月03日
浏览(104)
毕业设计选题基于深度学习的人流量预测系统人工智能 YOLO 计算机视觉

目录前言设计思路一、课题背景与意义二、算法理论原理 2.1 卷积神经网络 2.2 注意力机制三、检测的实现 3.1 数据处理 3.2 实验环境搭建 3.3 实验及结果分析最后 📅大四是整个大学期间最忙碌的时光,一边要忙着备考或实习为毕业后面临的就业升学做准备,一边要

2024年01月19日
浏览(81)
人类大脑与机器学习的对话：认知过程在人工智能中的应用

人工智能(Artificial Intelligence, AI)是一门研究如何让机器具有智能行为的科学。智能可以被定义为能够处理复杂问题、学习新知识以及适应新环境的能力。人类大脑是一个复杂的神经网络，它能够进行许多高级认知任务，如学习、记忆、推理、决策等。因此，研究人类大脑如何

2024年02月21日
浏览(57)
毕业设计：基于深度学习的绝缘子缺陷检测系统人工智能 YOLO 计算机视觉

目录前言一、课题背景与意义二、设计思路 2.1.多尺度特征融合 2.2 绝缘子缺陷检测三、模型训练 3.1 实验环境 3.2 结果分析最后前言 📅大四是整个大学期间最忙碌的时光,一边要忙着备考或实习为毕业后面临的就业升学做准备,一边要为毕业设计耗费大量精力。近几年各

2024年01月18日
浏览(145)
毕业设计选题-计算机视觉：复杂场景下的车牌识别系统人工智能深度学习 YOLO

目录前言项目背景与简介主要设计思路一、算法理论技术 1.1 神经网络基础 1.2 深度神经网络 1.3 目标检测二、数据处理 2.1 数据采集三、实现的效果更多帮助 📅大四是整个大学期间最忙碌的时光,一边要忙着备考或实习为毕业后面临的就业升学做准备,一边要为毕业设

2024年02月03日
浏览(101)
计算机竞赛基于人工智能的图像分类算法研究与实现 - 深度学习卷积神经网络图像分类

🔥 优质竞赛项目系列，今天要分享的是基于人工智能的图像分类技术该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！ 🧿 更多资料, 项目分享： https://gitee.com/dancheng-senior/postgraduate 传统CNN包含卷积层、全连接层等组件，并采用softmax多类别分类器和多类交叉熵损失

2024年02月11日
浏览(66)
毕业设计：基于机器学习的高压线障碍物识别系统人工智能 YOLO 计算机视觉

目录前言课题背景和意义实现技术思路一、障碍物检测方法 1.1 障碍物识别算法 1.2 Adaboost算法 1.3 支持向量机二、数据集三、实验及结果分析 3.1 实验环境搭建 3.2 模型训练最后 📅大四是整个大学期间最忙碌的时光,一边要忙着备考或实习为毕业后面临的就业升学

2024年02月21日
浏览(56)
毕业设计：基于深度学习的危险驾驶(抽烟、打电话)检测系统人工智能 python 计算机视觉

目录前言一、课题背景与意义二、算法理论技术 2.1 双路金字塔网络 2.2 算法实现三、模型训练 3.1 实验环境 3.2 结果分析最后 📅大四是整个大学期间最忙碌的时光,一边要忙着备考或实习为毕业后面临的就业升学做准备,一边要为毕业设计耗费大量精力。近几年各个学校要

2024年04月09日
浏览(104)
【SCI征稿】3个月左右录用！计算机信息技术等领域均可，如机器学习、遥感技术、人工智能、物联网、人工神经网络、数据挖掘、图像处理

计算机技术类SCIEEI 【期刊简介】IF：1.0-2.0，JCR4区，中科院4区【检索情况】SCIEEI 双检，正刊【参考周期】期刊部系统内提交，录用周期3个月左右，走完期刊部流程上线【征稿领域】计算机信息技术在土地变化检测中的应用包括但不限于以下主题： ● 利用基于机器学习的

2024年02月10日
浏览(67)