【目标检测】1. 目标检测概述

这篇具有很好参考价值的文章主要介绍了【目标检测】1. 目标检测概述。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

目标检测(Object Detection)实质上上多目标的定位,即在一个图片中定位多个目标物体,包括分类定位,也就是多个目标分别在哪里?分别属于那个类别?
 

图像分类常用算法:
        VGG
        GoogleNet
        ResNet

目标检测常用算法:
        RCNN
        Fast RNN
        Faster RCNN
        SSD
        YOLO

目标检测
检测图片中所有物体(模型关注的物体)的
●类别标签(Category Label)
●位置(最小外接矩形/Bounding Box) 通常表示为(x,y,w,h),其中(x,y)表示矩形框中心坐标,(w,h)表示矩形框长宽。
目标检测和其他任务的区别:

【目标检测】1. 目标检测概述,目标检测,人工智能,计算机视觉

 什么是语义分割?

与普通的图像分类任务不同,语义分割要求对图像中的每个像素进行分类,而不仅仅是对整个图像进行分类。换句话说,语义分割的目标是为图像中的每个像素赋予一个标签,指示其所属的语义类别。这意味着图像中的不同区域(如物体、背景、人等)都应被准确地标注和分割出来。

 目标检测的步骤:

●目标检测主要需要解决三个问题 :
        怎样确定位置(什么地方有目标)
        怎样提取特征
        怎样分类(目标属于什么类别)
●传统的目标检测一 般使用滑动窗口的框架,主要包括三个步骤:
        利用不同尺寸的滑动窗口框出图中的某一 部分作为候选区域;
        提取候选区域相关的视觉特征。比如人脸检测常用的Harr特征;行人检测常用HOG特征等;
        利用分类器进行识别,比如常用的SVM模型。

R-CNN
在传统目标检测算法中,多尺度形变部件模型(DPM)的效果相对是比较优秀的;在DPM中将物体看成是多个不同组件的结合,其效果不错,但是检测速度相对比较慢。随着深度学习模型效果的优化,基于深度学习的目标检测算法盖过了传统计算机视觉中的目标检测算法(DPM),从而导致很多之前研究传统目标检测算法的人员转向深度学习,并且现在工业界中应用最多的目标检测方式以深度学习为主。
R-CNN是奠定深度学习方向发展目标检测的的基础算法,是第一个真正可以工业级应用的目标检测解决方案,是结合区域提名(RegionProposal)和卷积神经网络(CNN)的一种目标检测算法。

基于深度学习的目标检测算法
●目前主流的目标检测算法主要是基于深度学习模型,主要可以分为两大类: two-stage检测算法和one- stage检测算法。
●two-stage检测算法将检测问题划分为两个阶段,首先基于region proposals (区域推荐)产生目标候选框,然后再对候选区域进行分类与回归,这类算法实现主要有: R-CNN、SPPNET、 FastR-CNN、 FasterR-CNN等 。
●one-stage检测算法是一 种端到端的检测算法,仅仅使用一个卷积神经网络CNN直接预测不同目标的类别与位置,这类算法实现主要有: SSD、 YOLO、 FPN等。

什么是Region Proposal?
Region Proposal是目标检测领域的一个关键概念。它是指在图像中提出潜在包含物体的候选区域,以便进一步对这些区域进行分类和定位。
Region Proposal的常见方法包括:

  1. Selective Search(选择性搜索): 自底向上通过合并相似的区域来生成最终的候选区域。
    【目标检测】1. 目标检测概述,目标检测,人工智能,计算机视觉
    【目标检测】1. 目标检测概述,目标检测,人工智能,计算机视觉
    【目标检测】1. 目标检测概述,目标检测,人工智能,计算机视觉

  2. EdgeBoxes: EdgeBoxes是一种基于边缘检测的Region Proposal方法,它利用图像中的边缘信息来定位候选区域,以提高检测的效率和准确率。

  3. R-CNN系列方法(如Fast R-CNN、Faster R-CNN等): 这些方法通过引入区域建议网络(Region Proposal Network,RPN),在图像中生成候选区域,并与分类器共同训练,从而实现端到端的目标检测。

置信度

●一幅图片的检测结果,由多个Bounding Box组成,一个Bounding Box包括以下信息:
        Bounding Box的位置信息(x,y,w,h)以及这个Bounding Box的置信度。
        Bounding Box的位置信息(x,y,w,h)由中心点坐标和宽高组成。
        Bounding Box的置信度表示该边框包含目标的概率。
●Bounding Box的置信度的计算通常基于边界框与目标的重叠程度、目标的大
小和形状等因素。不同的目标检测算法可能使用不同的方法来计算置信度(不同算法下置信度是没有比较意义的),但它们的基本思想是相似的。
●属于每个类别的置信度,这个置信度与图片分类任务的置信度的定义是相同的。
 

IoU(评价Region Proposal定位精度的评价方式)

IoU(Intersection over Union)。IoU定义了两个bounding box的重叠度,也就是两个bounding
box重叠区域的面积占总面积的比值。

【目标检测】1. 目标检测概述,目标检测,人工智能,计算机视觉

mAP指标

【目标检测】1. 目标检测概述,目标检测,人工智能,计算机视觉

【目标检测】1. 目标检测概述,目标检测,人工智能,计算机视觉

【目标检测】1. 目标检测概述,目标检测,人工智能,计算机视觉

 前面我们已经讲述了如何计算Precision和Recall,但是,正如前面所述,至少有两个变量会影响Precision和Recall,即IoU和Bounding Box的置信度阈值。IoU是一 个简单的几何度量,可以很容易标准化。但是置信度却在不同模型会差异较大,可能在一个模型中置信度采用0.5却等价于在其它模型中采用0.8置信度,这会导致precision-recall曲线变化。为此,PASCAL VOC组织者想到了一 种方法来解决这个问题,即要采用一种可以用于任何模型的评估指标,即mAP(mean Average Precision)。
mAP(mean Average Precision)在目标检测中定义为平均精度评估指标值。mAP就是 每一类平均精度AP (Average Precision) 的均值。AP就是对PR曲线(P:precision, R: recall, 横轴R,纵轴P)求均值。

【目标检测】1. 目标检测概述,目标检测,人工智能,计算机视觉

根据predict的置信度阈值进行排序, 上图中就是predict1 (0.9)、 predict2(0.8)、 predict3(0.7)的顺序,计算在不同阈值的情况下,Predicision和Reall的值:
●阈值0.9,无视所有小于0.9的predict(只对最左边的预测计算精度),那么此时TP=1,FP=0,precision=1,所有标签数目为3,那么recall=1/3;
●阈值0.8,无视所有小于0.8的predict(只对前两个预测计算精度),那么此时TP=1, FP=1, precision=1/2,所有标签数目为3,那么recall=1/3;
●阈值0.7,无视所有小于0.7的predict(对三个预测都计算精度), 那么此时TP=2, FP= 1, precision=2/3, 所有标签数目为3,那么recall=2/3。
 

【目标检测】1. 目标检测概述,目标检测,人工智能,计算机视觉

 NMS
●非极大值抑制(Non-Maximum-Suppression,NMS),顾名思义就是抑制不是极大值的元素,可以理解为局部最大搜索。是目标检测中常用的一种精修bounding box的方式。
●产生proposal后使用分类网络给出每个框的每类置信度,使用回归网络修正位置,最终应用NMS返回最终位置。
对于CNN网络提取出来的Bounding Box列表B以及其对应的置信度S,采用下列执行过程来进行NMS操作:

  •         从S和B中选择最大置信度score(至少大于0)以及对应Bounding Box框M,将其从B/S集合中移除,并将M加入到最终检测结果集合D中。
  •         计算B中剩下所有的Bounding Box和M之间的IOU值,如果|OU值大于阈值t,那么表示这两个框比较相似,则将其从集合B中移除,否则不进行任何操作。
  •         重复上述两个操作,直到集合B为空。
  •         NOTE: .上述操作针对每个类别进行操作。

lambelimg
        功能:一种进行目标检测的标注工具;
        官网: https://github.com/heartexlabs/labelimg
        安装: pip install labelimg

【目标检测】1. 目标检测概述,目标检测,人工智能,计算机视觉

【目标检测】1. 目标检测概述,目标检测,人工智能,计算机视觉

【目标检测】1. 目标检测概述,目标检测,人工智能,计算机视觉

【目标检测】1. 目标检测概述,目标检测,人工智能,计算机视觉文章来源地址https://www.toymoban.com/news/detail-838261.html

到了这里,关于【目标检测】1. 目标检测概述的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 毕业设计:基于深度学习的绝缘子缺陷检测系统 人工智能 YOLO 计算机视觉

    目录 前言 一、课题背景与意义 二、设计思路 2.1.多尺度特征融合 2.2 绝缘子缺陷检测 三、模型训练 3.1 实验环境 3.2 结果分析 最后 前言  📅大四是整个大学期间最忙碌的时光,一边要忙着备考或实习为毕业后面临的就业升学做准备,一边要为毕业设计耗费大量精力。近几年各

    2024年01月18日
    浏览(122)
  • 毕业设计:基于深度学习的危险驾驶(抽烟、打电话)检测系统 人工智能 python 计算机视觉

    目录 前言 一、课题背景与意义 二、算法理论技术 2.1 双路金字塔网络 2.2 算法实现 三、模型训练 3.1 实验环境 3.2 结果分析 最后  📅大四是整个大学期间最忙碌的时光,一边要忙着备考或实习为毕业后面临的就业升学做准备,一边要为毕业设计耗费大量精力。近几年各个学校要

    2024年04月09日
    浏览(95)
  • 迈向多模态AGI之开放世界目标检测 | 人工智能

    作者: 王斌 谢春宇 冷大炜 引言 目标检测是计算机视觉中的一个非常重要的基础任务,与常见的的图像分类/识别任务不同,目标检测需要模型在给出目标的类别之上,进一步给出目标的位置和大小信息,在CV三大任务(识别、检测、分割)中处于承上启下的关键地位。当前

    2024年02月16日
    浏览(44)
  • 人工智能 - 目标检测:发展历史、技术全解与实战

    本文全面回顾了目标检测技术的演进历程,从早期的滑动窗口和特征提取方法到深度学习的兴起,再到YOLO系列和Transformer的创新应用。通过对各阶段技术的深入分析,展现了计算机视觉领域的发展趋势和未来潜力。 关注TechLead,分享AI全维度知识。作者拥有10+年互联网服务架

    2024年02月05日
    浏览(54)
  • 人工智能TensorFlow PyTorch物体分类和目标检测合集【持续更新】

    1. 基于TensorFlow2.3.0的花卉识别 基于TensorFlow2.3.0的花卉识别Android APP设计_基于安卓的花卉识别_lilihewo的博客-CSDN博客 2. 基于TensorFlow2.3.0的垃圾分类 基于TensorFlow2.3.0的垃圾分类Android APP设计_def model_load(img_shape=(224, 224, 3)_lilihewo的博客-CSDN博客   3. 基于TensorFlow2.3.0的果蔬识别系统的

    2024年02月09日
    浏览(58)
  • 深入探索人工智能与计算机视觉

    在当今数字化时代,人工智能(AI)和计算机视觉(CV)作为两大前沿技术,正以惊人的速度改变着我们的生活。本文将深入探讨人工智能与计算机视觉的关系、应用以及未来发展方向。 1. 人工智能与计算机视觉的关系 人工智能是一门涵盖众多技术领域的学科,旨在使计算机

    2024年04月14日
    浏览(57)
  • AI一叶知秋:从目标检测部署浅谈人工智能发展

    笔者写这篇文章也有讨巧之嫌,仅以个人视角分享一些看法,主要从实践部署来谈谈近两年来计算机视觉模型的变化,不过AI是一个宏大的话题,每个人定义的人工智能就不一样,我们先来探讨一下何为人工智能。百度百科中是这样定义的: 人工智能是研究、开发用于模拟、

    2024年02月02日
    浏览(90)
  • 大数据毕业设计python+spark天气预测 天气可视化 天气大数据 空气质量检测 空气质量分析 气象大数据 气象分析 大数据毕设 计算机毕业设计 机器学习 深度学习 人工智能 知识图谱

    论文题目 选题依据 天气预测是指综合使用现代科学技术对某一地区未来一段时间的温度、湿度、风力、风向、天气状况等进行预测。在当今社会,天气预测对人们的生产生活有着举足轻重的影响,与日常出行、农业生产、自然灾害预防等多个领域息息相关,是现代社会正常运转

    2024年04月26日
    浏览(57)
  • 【人工智能课程】计算机科学博士作业三

    来源:李宏毅2022课程第10课的作业 图片攻击是指故意对数字图像进行修改,以使机器学习模型产生错误的输出或者产生预期之外的结果。这种攻击是通过将微小的、通常对人类难以察觉的扰动应用于输入图像来实现的。图片攻击是对深度学习系统中的鲁棒性和安全性的一种测

    2024年03月16日
    浏览(72)
  • 【人工智能课程】计算机科学博士作业一

    模型拟合:用深度神经网络拟合一个回归模型。从各种角度对其改进,评价指标为MSE。 掌握技巧: 熟悉并掌握深度学习模型训练的基本技巧。 提高PyTorch的使用熟练度。 掌握改进深度学习的方法。 数据集下载: Kaggle下载数据: https://www.kaggle.com/competitions/ml2022spring-hw1 百度云

    2024年01月23日
    浏览(58)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包