什么是目标检测--Object Detection

这篇具有很好参考价值的文章主要介绍了什么是目标检测--Object Detection。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

目标检测,也叫目标提取,是一种基于目标几何和统计特征的图像分割。它将目标的分割和识别合二为一,其准确性和实时性是整个系统的一项重要能力。目标检测不仅要用算法判断图片中物品的分类, 还要在图片中标记出它的位置, 用边框或红色方框把物品圈起来, 这就是目标检测问题。 

目标检测从2001年开始,在2012年成为分水岭,因为这一年基于深度学习的目标检测方法,逐渐使目标检测进入到快速发展的阶段,比较流行的算法可以分为两类,一类是基于Region Proposal的R-CNN系算法(RCNN、SPPNet、FasterRCNN、Pyramid NetWorks等),它们是two-stage的,需要先算法产生目标候选框,也就是目标位置,然后再对候选框做分类与回归。而另一类是Yolo,SSD这类one-stage算法,其仅仅使用一个卷积神经网络CNN直接预测不同目标的类别与位置。第一类方法是准确度高一些,但是速度慢,但是第二类算法是速度快,但是准确性要低一些。

一、统一的实时的目标检测

yolo将特征图划分为SXS的格子,每个格子负责对落入其中的目标进行检测,一次性预测所有格子所含目标不的边界框、定位置信度以及所有类别概率向量。

yolo算法的基本思想

(1)预测特征图

(2)多尺度整合

(3)锚框机制(Anchor)

通过特征提取网络对输入的图像进行特征提取,得到一定大小的特征图

预测得到的输出特征图有两个维度是摄取到的特征维度。

(1)非极大值抑制(NMS--Non-Maximum Suppression)

(2)损失函数(Loss Function)

包括:分类损失、定位损失、置信度损失

总的损失函数=分类损失+定位损失+置信度损失

二:目标检测的性能

检测精度 检测速度
Precision,Recall,F1 Score 前传耗时
IoU(交并比) FPS(每秒帧数)
P-R curve 浮点运算量(Flops)
AP(Average Precision)
mAP(mean Average Precision)

(一)精度

1、什么是混淆矩阵

精度:Precision=TP/(TP+FP)

召回率:Recall=TP/(TP+FN)

F1 score=2*Precision*Recall/(Precision+Recall)

什么是目标检测--Object Detection

2、IoU(交并比)

什么是目标检测--Object Detection

3、AP与mAP

AP衡量的是学习出来的模型在每个类别上的好坏。

mAP衡量的是学出来的模型在所有类别上的好坏,是所有类别AP的平均值。

(二)检测速度

1、前传耗时(ms):从输入的一张图像到输出最终检测结果所消耗的时间。

2、每秒帧数(FPS):每秒钟能处理的图像数量。

3、浮点运算量(FLOPS):处理的每一张图像所需要的浮点运算数量。

三:目标检测数据集

1、Pascal Voc

Pacal VOC挑战赛在2005年-2012年间展开,共有两个数据集 Pascal VOC2007(9963张图像,24640个标注)和Pascal VOC2012(11530张图像,27450个标注),该数据集有20个分类。

2、MS COCO

起源于微软于2014年出资标注的Microsoft COCO数据集,与ImageNet竞赛一样,被视为是计算机视觉领域最受关注和最权威的比赛之一。COCO数据集包含20万个图像,其中11.5万张训练集图像,5千张验证集图像,2万多张测试集图像。80个类别中有超过50万个目标标注。

COCO竞赛成为当前目标识别和检测等领域的一个最权威、最重要的标杆,也是目前该领域在国际上能唯一能汇集Google、微软、Facebook以及国内外众多顶尖院校和优秀企业共同参与的大赛。

网站地址:http://cocodataset.org

四:目前国内主流的目标检测技术:

1、YOLOX:由中国的旷视科技研发,是目前国际上运行速度最快的一种深度学习模型。

2、YOLOV1-V5:Yolov1-yolov3由Joseph Redmon研发,yolov4-yolov5则是由yolo团队内部成员完成的。

3、Transformer:原来是做为语音识别的一个模型,现在用在图像的目标识别上面也有不俗的表现

4、ViT:当考虑预训练模型的计算成本时,ViT的性能非常好,以较低的预训练成本在大多数识别基准上达到了最先进的水平。

什么是目标检测--Object Detection

以下为课程预告,我们将遂一的为大家介绍以上目标检测技术,有兴趣的小伙伴可以关注我的微博,我将随时公布培训时间及报名方式。文章来源地址https://www.toymoban.com/news/detail-465711.html

到了这里,关于什么是目标检测--Object Detection的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • opencv dnn模块 示例(19) 目标检测 object_detection 之 yolox

    YOLOX是旷视科技在2021年发表,对标YOLO v5。YOLOX中引入了当年的黑科技主要有三点,decoupled head、anchor-free以及advanced label assigning strategy(SimOTA)。YOLOX的性能如何呢,可以参考原论文图一如下图所示。YOLOX比当年的YOLO v5略好一点,并且利用YOLOX获得当年的Streaming Perception Challenge第一

    2024年02月06日
    浏览(49)
  • [深度学习]Open Vocabulary Object Detection 部署开放域目标检测模型使用感受

    Open Vocabulary Object Detection (OpenVOD) 是一种新型的目标检测方法,它使用开放词汇的概念来识别和检测图像中的对象。与传统的目标检测方法相比,OpenVOD具有更高的灵活性和可扩展性,因为它允许用户自定义对象类别和词汇,从而能够适应各种不同的应用场景和需求。 OpenVOD的核

    2024年01月22日
    浏览(53)
  • 遥感目标检测(3)-DAL(Dynamic Anchor Learning for Object Detection)

    目录 一、概述 二、背景 三、建议 1、旋转RetinaNet 2、动态锚框分布 3、匹配敏感损失  四、实验         由于选择正样本锚框进行回归,不一定能够定位真实的GT,而部分负样本回归甚至可以回归到真实的GT,说明相当多的负样本锚框有着准确定位的能力,这说明IoU进行回归

    2024年02月16日
    浏览(46)
  • 目标检测(Object Detection):Fast R-CNN,YOLO v3

    目录 目标检测(Object Detection) R-CNN SPPNet Fast R-CNN YOLO v1 YOLO v2 YOLO v3 任务是计算机视觉中非常重要的基础问题,也是解决图像分割、目标跟踪、图像描述等问题的基础。目标检测是检测输入图像是否存在给定类别的物体,如果存在,输出物体在图像中的位置信息(矩形框的坐标

    2024年02月11日
    浏览(43)
  • 【论文阅读】Untargeted Backdoor Attack Against Object Detection(针对目标检测的无目标后门攻击)

    论文题目: Untargeted Backdoor Attack Against Object Detection(针对目标检测的无目标后门攻击) 发表年份: 2023-ICASSP(CCF-B) 作者信息: Chengxiao Luo (清华大学深圳国际研究生院) Yiming Li(清华大学深圳国际研究生院) Yong Jiang(清华大学深圳国际研究生院,鹏程实验室人工智能研

    2024年02月09日
    浏览(38)
  • cvpr2023-目标检测-Combating noisy labels in object detection datasets

    我们都知道数据对于深度学习模型的重要性,但是如何省时省力的得到高质量的数据呢?这就是此文章探讨的问题。 目录 1. 论文下载 2. 背景  3. 相关技术 4. 创新点 5. 算法 5.1 置信学习(Confident learning)  5.2 目标检测中的CL算法 https://arxiv.org/abs/2211.13993 对于深度学习模型来

    2024年02月06日
    浏览(48)
  • opencv dnn模块 示例(25) 目标检测 object_detection 之 yolov9

    YOLOv9 是 YOLOv7 研究团队推出的最新目标检测网络,它是 YOLO(You Only Look Once)系列的最新迭代。YOLOv9 在设计上旨在解决深度学习中信息瓶颈问题,并提高模型在不同任务上的准确性和参数效率。 Programmable Gradient Information (PGI) :YOLOv9 引入了可编程梯度信息(PGI)的概念,这是

    2024年04月29日
    浏览(43)
  • opencv dnn模块 示例(16) 目标检测 object_detection 之 yolov4

    博客【opencv dnn模块 示例(3) 目标检测 object_detection (2) YOLO object detection】 测试了yolov3 及之前系列的模型,有在博客【opencv dnn模块 示例(15) opencv4.2版本dnn支持cuda加速(vs2015异常解决)】 说明了如何使用dnn模块进行cuda加速推理。 本文说明yolo v4的网络改进和测试情况。 yolo v1~

    2024年02月07日
    浏览(42)
  • 【开放域目标检测】一:Open-Vocabulary Object Detection Using Captions论文讲解

    出发点是制定一种更加通用的目标检测问题,目的是借助于大量的image-caption数据来覆盖更多的object concept,使得object detection不再受限于带标注数据的少数类别,从而实现更加泛化的object detection,识别出更多novel的物体类别。 尽管深度神经网络在目标检测方面具有显著的准确

    2024年02月11日
    浏览(42)
  • 【3D目标检测】Monocular 3D Object Detection with Pseudo-LiDAR Point Cloud

    本文的输入数据仅仅是单目图像,在方法上是融合了伪点云(Pseudo-LiDAR)的深度信息表示方法与Frustum PointNets的检测方法。 乍一看文章和伪点云原论文 Pseudo-LiDAR from Visual Depth Estimation: Bridging the Gap in 3D Object Detection for AD 一模一样,但是会更具体一点,也就是本文只关注单目图

    2024年02月05日
    浏览(52)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包