深度学习（22）——YOLO系列（3）

这篇具有很好参考价值的文章主要介绍了深度学习（22）——YOLO系列（3）。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

深度学习（24）——YOLO系列（3）

今天YOLOv4理论版

1. BOF(bag of freebies)

只增强训练成本，但是能显著提高精度，但是不影响推理速度
数据增强：调整亮度，对比度，色调，随机缩放…
网络正则化的方法：dropout，dropblock
类别不平衡——>损失函数设计

2. Mosaic data augmentation

参考cutmix，以前就存在，将增强的四张图像拼接在一张进行训练（相当于间接增加batch）

3. 数据增强

random erase：随机遮挡或擦除
hide and seek:根据概率随机隐藏补丁

4. self-adversarial-training（SAT）

在原始图像中增加噪音点干扰

5. dropblock

dropout是随机选择一些点遮住（游戏难度增加不大），dropblock现在遮住一个区域（游戏难度增大）
深度学习（22）——YOLO系列（3）

6. label smoothing

神经网络最大的缺点，标签绝对，容易过拟合
使用之后，簇内更紧密，簇间更分离

7. 损失函数

a. IOU损失

相同的IOU却反映不出实际情况到底是怎么样的
当交集为0时，没有梯度无法计算（梯度消失）

b.GIOU

深度学习（22）——YOLO系列（3）

引入最小封闭框C（C可以把A,B包含在内）
在不重叠的情况下可以使预测框尽可能靠近真实框
解决了梯度下降的问题，但是重叠的时候失灵

c. DIOU

深度学习（22）——YOLO系列（3）

附加项的分子项：预测框与真实框中心点的欧氏距离
附加项的分母项：最小封闭框的对角线长度C
直接优化距离，速度更快，并解决GIOU

d.CIOU

深度学习（22）——YOLO系列（3）

考虑三个几何因素：
- 重叠面积
- 中心点距离
- 长宽比（v）

8. SPPNet（spatial pyramid pooling）

为了更好满足不同输入大小，训练的时候要改变输入数据的大小
SPP其实就是用最大池化来满足最终输入特征一致即可

9. CSPNet（cross stage partial network）【更快】

深度学习（22）——YOLO系列（3）

每个block 按照特征图的channel维度拆分成两部分
一份正常走网络，另一份直接concat到这个block的输出

10.CBAM & SAM

深度学习（22）——YOLO系列（3）

计算量太大！所以在V4中，引入SAM ，没有channel之间的attention，只有spatial空间attention（attention可以让模型更好学习特征）

11.YOLO中的attention链接机制

深度学习（22）——YOLO系列（3）

12. PAN

FPN是自顶向下的模式，将高层特征传下来，高层逐层向下兼容下层（单向）
缺少底层到高层，PAN登场
引入自底向上的路径，使得底层信息更容易传到顶部
还是一个捷径，红色的可能要走100+层，绿色只需要几层就OK

13. PAN的连接方式

深度学习（22）——YOLO系列（3）

14. 激活函数

深度学习（22）——YOLO系列（3）

15. 网络结构

深度学习（22）——YOLO系列（3）文章来源地址https://www.toymoban.com/news/detail-489546.html

16.优点

使用单个GPU就可以训练很好
量大核心方法：数据层面+网络层面
消融实验
速度快，性能高！

到了这里，关于深度学习（22）——YOLO系列（3）的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

Toy模板网

深度学习（22）——YOLO系列（3）

深度学习（24）——YOLO系列（3）

1. BOF(bag of freebies)

2. Mosaic data augmentation

3. 数据增强

4. self-adversarial-training（SAT）

5. dropblock

6. label smoothing

7. 损失函数

a. IOU损失

b.GIOU

c. DIOU

d.CIOU

8. SPPNet（spatial pyramid pooling）

9. CSPNet（cross stage partial network）【更快】

10.CBAM & SAM

11.YOLO中的attention链接机制

12. PAN

13. PAN的连接方式

14. 激活函数

15. 网络结构

16.优点

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏

支付宝扫一扫领取红包，优惠每天领

二维码1

二维码2