基于睿抗机器人大赛机器狗图像识别任务YOLO系列算法优缺点与YOLOv3的对比(纯文本)
引言
以往的二阶段检测算法,例如Faster-RCNN,在检测时需要经过两步:边框回归和
softmax分类。由于大量预选框的生成,该方法检测精度较高,但实时性较差。
鉴于此,YOLO之父Joseph Redmon创新性的提出了通过直接回归的方式获取目标检测的具体位置信息和类别分类信息,极大的降低了计算量,显著提升了检测的速度,达到了45FPS(Fast YOLO版本达到了155FPS)。
一、YOLOv1:
优势与不足
(1)优势:与二阶段检测算法相比,利用直接回归的方式,大大缩小了计算量,提升了运行速度。
(2)不足:每一个网格仅2个预测框,当存在多物体密集挨着的时候或者小目标的时候,检测效果不好。(每个单元预测固定数量的边界框和类别,当目标较小时预测边框2个导致误检漏检)
二、YOLOv2
技术改进和革新:
-
更换骨干网络;
-
引入PassThrough;
-
借鉴二阶段检测的思想,添加了预选框。
YOLOv2检测算法是将图片输入到darknet19网络中提取特征图,然后输出目标框类别信息和位置信息。
优势与不足
(1)优势:利用passthrough操作对高低层语义信息进行融合,在一定程度上增强了小目标的检测能力。采用小卷积核替代7x7大卷积核,降低了计算量。同时改进的位置偏移的策略降低了检测目标框的难度。
(2)不足:尚未采用残差网络结构。且当存在多物体密集挨着的时候或者小目标的时候,检测效果有待提升。
三、YOLOv3
技术改进和革新:
-
在darknet19的基础上推陈出新,引入残差,并加深网络深度,提出了Darkent53。
-
借鉴了特征金字塔的思想,在三个不同的尺寸上分别进行预测。
优势与不足
(1)优势:基本解决了小目标检测的问题,在速度和精度上实现了较好的平衡。在目标检测准确性方面有所提升。通过引入多尺度检测机制,YOLOv3能够更好地处理不同尺度的目标,并提供更全面的检测结果。
(2)不足:网络结构相对更大且复杂,因此其模型大小也相应较大。这可能导致在资源受限的设备上运行时的一些挑战,速度与YOLOv1和YOLOv2相比较慢。
四、YOLOv4
技术改进和革新
1 将CSP结构融入Darknet53中,生成了新的主干网络CSPDarkent53
2采用SPP空间金字塔池化来扩大感受野
3在Neck部分引入PAN结构,即FPN+PAN的形式
4引入Mish激活函数
5 引入Mosaic数据增强
6训练时采用CIOU_loss ,同时预测时采用DIOU_nms
YOLOv4和YOLOv3的优缺点对比:
优点:
YOLOv4:
- 更高的检测精度:YOLOv4相较于YOLOv3在目标检测精度方面有显著提升。它采用了一系列改进的技术,包括CSPDarknet53作为基础网络、PANet和SAM等模块的引入,以及使用更细粒度的特征金字塔等,这些改进使得YOLOv4能够更准确地检测目标。
- 更强大的目标检测能力:YOLOv4引入了更多的技术和策略,如切割图片训练、数据增强策略的改进、损失函数的优化等,这些改进使得YOLOv4能够有效地处理小目标、密集目标和大尺寸目标等各种情况。
- 较高的实时性能:尽管YOLOv4在精度方面有所提升,但它仍能在相对较快的速度下实现实时目标检测,适用于需要高实时性能的应用场景。
YOLOv3:
- 良好的目标检测性能:YOLOv3是YOLO系列中较早版本的算法,具有较成熟的目标检测能力。它采用了多尺度检测策略和特征金字塔网络,可以准确地检测各种尺寸的目标。
- 相对较快的速度:尽管YOLOv3相对于YOLOv4在精度方面稍有劣势,但它具有较快的目标检测速度,适用于需要实时响应的应用场景。
缺点:
YOLOv4:
- 相对复杂的网络结构:YOLOv4采用了CSPDarknet53作为基础网络,这个网络结构较复杂,模型的计算资源需求较高,不适用于资源受限的设备。
- 较大的模型大小:由于引入了更多的技术和策略,YOLOv4相较于YOLOv3具有较大的模型大小,这可能对部署和存储造成一定的挑战。
YOLOv3:
- 相对较低的精度:相较于YOLOv4,YOLOv3在目标检测精度方面相对稍低。它采用的网络结构和技术相对较旧,可能无法满足某些应用对精度的要求。
- 较大的目标位置误差:YOLOv3在处理密集目标和小尺寸目标时,可能会出现较大的目标位置误差,这可能会影响目标定位的准确性。
总结:
YOLOv4在目标检测精度方面相较于YOLOv3有了明显的提升,并具有更强大的目标检测能力。然而,YOLOv4的网络结构较为复杂,模型大小较大,对计算资源和存储资源有一定要求。YOLOv3具有较好的实时性能和较低的目标位置误差,适用于对实时性能要求较高的应用场景。选择适合的版本应基于具体的应用需求、资源限制和性能要求。
五、YOLOv5
概述
YOLOv5版本 UltralyticsLLC 公司推出的,是在YOLOv4的基础上做了少许的修补,由于改进比较小,仅做简单介绍。
技术改进和革新:
-
将v4版本骨干网络中的csp结构拓展到了NECK结构中。
-
增加了FOCUS操作,但是后续6.1版本中又剔除掉了该操作,使用一个6x6的卷积进行了替代。
-
使用SPPF结构代替了SPP。
主要区别就是MaxPool由原来的并行调整为了串行,效率更高,降低了耗时。自适应锚框计算,就是把锚框的聚类改为了使用程序进行自适应计算
YOLOv5和YOLOv3的优缺点对比:
优点:
YOLOv5:
- 更高的检测精度:YOLOv5在目标检测精度方面相较于YOLOv3有所提升。它使用了一些改进的技术和网络结构,如使用更大的网络版本、PANet、Mosaic数据增强等,以提高检测结果的准确性。
- 较小的网络结构:YOLOv5相较于YOLOv3具有较小的网络结构,在保持较高的检测精度的同时,减小了模型的体积和计算资源的需求,更适合在资源受限的设备上使用。
- 更广泛的应用场景:YOLOv5支持多种目标检测任务,包括物体检测、人脸检测、车辆检测等,具有较好的通用性和泛化能力。
YOLOv3:
- 强大的实时检测能力:YOLOv3在实时目标检测方面具有较高的性能,并能够处理密集目标和小尺寸目标的检测,适用于需要实时响应的应用场景。
- 支持多尺度检测:YOLOv3使用了多尺度检测策略,在不同尺度的特征图上进行目标检测,提高了检测的准确性和目标定位的精度。
- 较成熟的算法和社区支持:YOLOv3是YOLO系列的较早版本,已经经过多次迭代和改进。它具有相对成熟的算法和广泛的社区支持,有很多基于YOLOv3的实现和相关资源可供参考。
缺点:
YOLOv5:
- 相对较新的版本:相较于YOLOv3,YOLOv5是较新的版本,可能在算法和模型设计上仍存在一些不稳定因素和改进空间,可能需更多的实践和验证。
- 较大的训练数据需求:YOLOv5在一些应用场景下可能需要更大规模的训练数据来达到好的检测效果,这可能对资源有一定的要求。
YOLOv3:
- 相对较慢的速度:相较于YOLOv5,YOLOv3在某些情况下可能具有较慢的检测速度,这主要是由于它更复杂的网络结构和多尺度检测策略所导致的。
- 网络结构较大:YOLOv3相对于YOLOv5具有较大的网络结构(Darknet-53),因此模型的体积较大,可能对资源受限的设备有一定挑战。
总结:
YOLOv5在检测精度和模型大小方面相较于YOLOv3有所提升,并且支持更广泛的应用场景。然而,YOLOv3在实时检测以及较成熟的算法和社区支持方面具有优势。选择适合的版本取决于具体的应用需求、资源限制和性能要求。
YOLOv6算法是2022年美团视觉智能部研发的一款目标检测框架,致力于工业应用。论文题目是**《YOLOv6: A Single-Stage Object Detection Framework for Industrial Applications》,**详细改进请阅读论文。
原文地址:YOLOv6: A Single-Stage Object Detection Framework for IndustrialApplications
参考文献
[1]You Only Look Once:Unified, Real-Time Object Detection
[2]YOLO9000:Better, Faster, Stronger
[3]YOLOv3: An Incremental Improvement
[4]YOLOv4: Optimal Speed and Accuracy of Object Detection
[5]YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for real-time object
[6]YOLOX: Exceeding YOLO Series in 2021
[7]You Only Learn One Representation: Unified Network for Multiple Tasks
[8]https://github.com/ultralytics/yolov5
[9]https://zhuanlan.zhihu.com/p/356997695
[10]https://blog.csdn.net/qq_37541097/article/details/81214953
[11]https://blog.csdn.net/weixin_42102248/article/details/102665185
[12]https://zhuanlan.zhihu.com/p/143747206
[13]https://www.jianshu.com/p/fa9b8b4361e8
[14]https://mp.weixin.qq.com/s/Qe_CzqedocqZ9ivhZRmoSA
[15]RepVGG: Making VGG-style ConvNets Great Again文章来源:https://www.toymoban.com/news/detail-745898.html
[16]https://mp.weixin.qq.com/s/5qK1文章来源地址https://www.toymoban.com/news/detail-745898.html
到了这里,关于YOLO系列算法与YOLOv3的优缺点对比的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!