计算机视觉与深度学习-图像分割-视觉识别任务01-语义分割-【北邮鲁鹏】-Toy模板网

这篇具有很好参考价值的文章主要介绍了计算机视觉与深度学习-图像分割-视觉识别任务01-语义分割-【北邮鲁鹏】。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

视觉识别任务

计算机视觉与深度学习-图像分割-视觉识别任务01-语义分割-【北邮鲁鹏】,# 计算机视觉,计算机视觉,深度学习,人工智能

语义分割

语义分割定义

给每个像素分配类别标签。

不区分实例，只考虑像素类别。

计算机视觉与深度学习-图像分割-视觉识别任务01-语义分割-【北邮鲁鹏】,# 计算机视觉,计算机视觉,深度学习,人工智能

语义分割思路：滑动窗口

计算机视觉与深度学习-图像分割-视觉识别任务01-语义分割-【北邮鲁鹏】,# 计算机视觉,计算机视觉,深度学习,人工智能

滑动窗口缺点

重叠区域的特征反复被计算，效率很低。

所以针对该问题提出了新的解决方案–全卷积。

语义分割思路（全卷积）

让整个网络只包含卷积层，一次性输出所有像素的类别预测。
计算机视觉与深度学习-图像分割-视觉识别任务01-语义分割-【北邮鲁鹏】,# 计算机视觉,计算机视觉,深度学习,人工智能

全卷积优点

不用将图片分为一个个小区域然后再对这一个个小区域进行分类，而是一次性输出像素的类别预测，减少了重叠区域重复计算，从而减少了运算量，加快了运算速度。

全卷积缺点

1 处理过程中一直保持原始分辨率，即卷积过程中一直保持图片长宽不变。对于显存的需求会非常庞大，甚至使得前向数据不能完整的保存在显存中。

针对这个问题，提出了先下采样然后上采样。

2 上采样是根据下采样得到的高级语义得到的，但是有时候高级语义效果并不好，还需要使用低级语义。

针对这个问题，提出了Unet，将下采样过程中的低级语义整合到上采样过程中，从而使得效果更好。

先下采样再上采样

计算机视觉与深度学习-图像分割-视觉识别任务01-语义分割-【北邮鲁鹏】,# 计算机视觉,计算机视觉,深度学习,人工智能

下采样算法

pooling（池化）

strided convolution

上采样算法

unpooling（反池化）

nearest neighbor

对于每个池化区域，最近邻反池化会将池化后的值复制到恢复区域的每个位置，以填充恢复区域。这样，可以将特征图恢复到与池化之前相同的尺寸。
计算机视觉与深度学习-图像分割-视觉识别任务01-语义分割-【北邮鲁鹏】,# 计算机视觉,计算机视觉,深度学习,人工智能
需要注意的是，最近邻反池化是一种近似的逆操作，因为池化操作中的信息丢失是不可逆的。因此，最近邻反池化只能恢复到大致相似的尺寸和分布，而无法完全还原原始特征图。