计算机视觉｜目标检测与MMDetection-Toy模板网

这篇具有很好参考价值的文章主要介绍了计算机视觉｜目标检测与MMDetection。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

改进思路 1:使用启发式算法替换暴力遍历用相对低计算量的方式粗筛出可能包含物体的位置，再使用卷积网络预测早期二阶段方法使用，依赖外部算法，系统实现复杂
改进思路 2: 减少冗余计算，使用卷积网络实现密集预测目前普遍采用的方式，用卷积一次性计算所有特征，再取出对应位置的特征完成分类。

3、感受野（Receptive Field）

感受野:神经网络中，一个神经元能“看到”的原图的区域
换句话说:

再换句话说：

4、边界框回归（Bounding Box Regression）

问题
滑窗 (或其他方式产生的基准框)与物体精准边界通常有偏差
处理方法
让模型在预测物体类别同时预测边界框相对于滑窗的偏移量
多任务学习

计算机视觉｜目标检测与MMDetection

5、基于锚框vs无锚框

计算机视觉｜目标检测与MMDetection

6、非极大值抑制 NMS

滑窗类算法通常会在物体周围给出多个相近的检测框这些框实际指向同一物体，只需要保留其中置信度最高的

算法实现：

计算机视觉｜目标检测与MMDetection

7、密集预测模型的训练

计算机视觉｜目标检测与MMDetection

匹配的基本思路

8、密集预测的基本范式

计算机视觉｜目标检测与MMDetection

9、如何处理尺度问题

图像中物体大小可能有很大差异(10 px ~ 500 px)

朴素的密集范式中，如果让模型基于主干网络最后一层或倒数第二层特征图进行预测：

解决：

单阶段算法直接通过密集预测产生检测框，相比于两阶段算法，模型结构简单、速度快，易于在设备上部署。
早期由于主干网络、多尺度技术等相关技术不成熟，单阶段算法在性能上不如两阶段算法，但因为速度和简洁的优势仍受到工业界青睐随着单阶段算法性能逐渐提升，成为目标检测的主流方法

1、YOLO：You Only Look Once（2015）

最早的单阶段检测器之一，激发了单阶段算法的研究潮流

主干网络: 自行设计的 DarkNet 结构，产生 7x7x1024 维的特征图

检测头: 2 层全连接层产生 7x7 组预测结果，对应图中 7x7 个空间位置上物体的类别和边界框的位置

计算机视觉｜目标检测与MMDetection

2、SSD Single Shot MultiBox Detector（2016）

计算机视觉｜目标检测与MMDetection

3、RetinaNet（2017）

计算机视觉｜目标检测与MMDetection

单阶段算法面临的正负样本不均衡问题

4、YOLOv3（2018）

自定义的 DarkNet-53 主千网络和类 FPN 结构，产生 1/8、1/16、1/32 降采样率的 3 级特征图
在每级特征图上设置 3 个尺寸的锚框，锚框尺寸通过对真值框聚类得到
两层卷积构成的密集预测头，在每个位置、针对每个锚框产生 80 个类别预测、4个边界框偏移量、1个 objectness 预测，每级特征图 3x(80+4+1)=255 通道的预测值

计算机视觉｜目标检测与MMDetection