【目标检测】-入门知识

这篇具有很好参考价值的文章主要介绍了【目标检测】-入门知识。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

1、回归与分类问题

回归问题是指给定输入变量(特征)和一个连续的输出变量(标签),建立一个函数来预测输出变量的值。换句话说,回归问题的目标是预测一个连续的输出值,例如预测房价、股票价格、销售额等。回归问题通常使用回归分析技术,例如线性回归、多项式回归、决策树回归等。

分类问题是指给定输入变量(特征)和一个离散的输出变量(标签),建立一个函数来预测输出变量的类别。换句话说,分类问题的目标是预测一个离散的输出值,例如将一张图片分为猫和狗、预测一个电子邮件是垃圾邮件还是正常邮件等。分类问题通常使用分类算法,例如逻辑回归、支持向量机、决策树分类等。

2、专业术语

2.1、bounding box 边界框

用来描述目标在图像中真实位置和范围的矩形框。它由矩形框的左上角和右下角坐标定义。

2.2、IOU交并比

intersection over union

预测区域与实际区域的交集比并集,值越大,预测越准

【目标检测】-入门知识,从零开始之目标检测,目标检测,人工智能,计算机视觉

2.3、非极大值抑制NMS

Non-Maximum Suppression

可能多个预测结果间存在重叠部分,需要保留交并比最大的、去掉非最大的预测结果。对同一个物体预测结果包含三个概率0.8/0.9/0.95,经过非极大值抑制后,仅保留概率最大的预测结果

【目标检测】-入门知识,从零开始之目标检测,目标检测,人工智能,计算机视觉

2.4、anchor box锚框

有的(如Faster RCNN)称为anchor(锚点),有的(如SSD)称为prior bounding box(先验框)

与bounding box相比,属于候选框

遍历输入图像上所有可能的像素框,然后选出正确的目标框,并对位置和大小进行调整就可以完成目标检测任务。这些进行预测的像素框就叫锚框。为了增加任务成功的几率,通常会在同一位置设置不同宽高比的锚框

判断一个锚框是否与目标框相近的指标,利用IUO,并设置最小阈值,区分目标先验框,还是背景先验框

【目标检测】-入门知识,从零开始之目标检测,目标检测,人工智能,计算机视觉

先验框参数设置:尺度(scale)与宽高比(ratio)

先把原图像处理后得到7x7的feature map,再在对应的feature map中生成锚框

并画出了在中间位置的具有不同scale 和 ratio 参数的9个锚框

【目标检测】-入门知识,从零开始之目标检测,目标检测,人工智能,计算机视觉

2.3、mAP平均精度均值

Mean Average Precision

衡量预测准确率指标常用  准确率( accuracy )、精确率( precision )、召回率(recall)

【目标检测】-入门知识,从零开始之目标检测,目标检测,人工智能,计算机视觉

(1) True positives(TP): 被正确地划分为正例的个数,即实际为正例且被分类器划分为正例的实例数(样本数);

(2) False positives(FP): 被错误地划分为正例的个数,即实际为负例但被分类器划分为正例的实例数; 

(3) False negatives(FN):被错误地划分为负例的个数,即实际为正例但被分类器划分为负例的实例数;

(4) True negatives(TN): 被正确地划分为负例的个数,即实际为负例且被分类器划分为负例的实例数;

P代表precision,精确率表示预测样本中实际正样本数占所有正样本数的比例, = A / (A+B)

R代表recall,召回率表示预测样本中实际正样本数占所有预测的样本的比例, = A / (A+C)

AP代表Average Precision,即一个类别的平均精确度。等价于P-R曲线下的面积;

【目标检测】-入门知识,从零开始之目标检测,目标检测,人工智能,计算机视觉

 mAP是 Mean Average Precision的缩写,即均值平均精度。作为 object dection 中衡量检测精度的指标。计算公式为:mAP = 所有类别的平均精度求和/所有类别

2.4、Region proposal 候选区域

给定输入图像查找可以定位对象的所有可能位置。此阶段的输出应该是对象的可能位置的边界框列表。这些通常被称为区域提案或感兴趣的区域。为每种分类创立独立的区域大小

 文章来源地址https://www.toymoban.com/news/detail-852418.html

2.5、RPN 区域候选网络

Region Proposal Network。也就是“提取候选框”的意思。RPN 首次在Faster RCNN结构中提出。RPN的目标是代替Selective Search实现候选框的提取。一方面RPN耗时少,另一方面RPN很容易结合到Fast RCNN中,成为一个整体。

Faster RCNN = RPN + Fast RCNN

【目标检测】-入门知识,从零开始之目标检测,目标检测,人工智能,计算机视觉

【目标检测】-入门知识,从零开始之目标检测,目标检测,人工智能,计算机视觉

【目标检测】-入门知识,从零开始之目标检测,目标检测,人工智能,计算机视觉

  1. 首先将P × Q大小的原始image缩放至固定大小M × N ;
  2. 然后将M × N 的image送入网络(备注:Conv layers中包含了13个conv层+13个relu层+4个pooling层),生成共享Feature Map
  3. 进入RPN网络,首先经过 3 × 3卷积,再分别生成positive anchors和对应bounding box regression偏移量,然后计算出proposals;
  4. 进入Roi Pooling层,利用proposals从feature maps中提取proposal feature送入后续全连接和softmax网络作classification(即分类proposal到底是什么object)。

详细参考...... 

2.6、ROI Pooling(感兴趣区域池化)

Region of interest pooling

用于目标检测任务的神经网络层,

  1. 从具有多个卷积和最大池层的深度卷积网络获得的固定大小的特征映射
  2. 表示感兴趣区域列表的N×5矩阵,其中N是RoI的数量。第一列表示图像索引,其余四列是区域左上角和右下角的坐标

一个区域建议(左上角,右下角坐标)(0,3),(7,8)

通过将其划分为(2×2)个部分(因为输出大小为2×2),提取 每个部分的最大值

【目标检测】-入门知识,从零开始之目标检测,目标检测,人工智能,计算机视觉

最后得到 

【目标检测】-入门知识,从零开始之目标检测,目标检测,人工智能,计算机视觉

【目标检测】-入门知识,从零开始之目标检测,目标检测,人工智能,计算机视觉

 

本文部分内容参考

 目标检测(Object Detection)-CSDN博客

锚框(anchor box)/先验框(prior bounding box)概念介绍及其生成-CSDN博客

ROI Pooling(感兴趣区域池化)-CSDN博客

 

到了这里,关于【目标检测】-入门知识的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【1】从零开始学习目标检测:YOLO算法详解

    在过去的十年中,深度学习技术的发展引起了极大的关注,并成为人工智能领域中不可或缺的技术之一。深度学习在计算机视觉领域的应用越来越广泛,其中目标检测是备受关注的领域之一。目标检测是指在图像或视频中检测出目标的位置和边界框,然后对目标进行分类或识

    2023年04月15日
    浏览(38)
  • 从零开始的目标检测和关键点检测(一):用labelme标注数据集

    前言 :前段时间用到了mmlab的mmdetction和mmpose,因此以一个小的数据集复现了从数据集制作到模型训练和测试的全流程。希望对想入门mmlab框架的小伙伴有所帮助。主要想做目标检测和关键点检测,因此标注目标检测框和关键点。标注范式:注意关键点只能在一个目标检测框内

    2024年02月06日
    浏览(51)
  • 从零开始的目标检测和关键点检测(二):训练一个Glue的RTMDet模型

    从零开始的目标检测和关键点检测(一):用labelme标注数据集 从零开始的目标检测和关键点检测(三):训练一个Glue的RTMPose模型 在 [1]用labelme标注自己的数据集 中已经标注好数据集(关键点和检测框),通过labelme2coco脚本将所有的labelme json文件集成为两个coco格式的json文件,

    2024年02月06日
    浏览(36)
  • 从零开始的目标检测和关键点检测(三):训练一个Glue的RTMPose模型

    从零开始的目标检测和关键点检测(一):用labelme标注数据集 从零开始的目标检测和关键点检测(二):训练一个Glue的RTMDet模型 1、数据集类型即coco格式的数据集,在dataset_info声明classes、keypoint_info(关键点)、skeleton_info(骨架信息)。 2、训练参数 3、模型定义、数据预处理、

    2024年02月06日
    浏览(40)
  • YOLOv5目标检测:ubuntu1804从零开始使用YOLOv5训练自己的数据集(亲测有效,一步一步来一定行)

    (1)首先需要安装Anaconda,这个网上教程太多了,下载最新版本就行,在这里就不在赘述了。 (2)安装Pytorch 1. 首先创建python3.6以上版本的conda环境,在这里我用的是python3.8,环境名称为mypytorch 2. 激活创建好的conda环境 3.在PyTorch官网上选择指定版本安装Pytorch Install PyTorch: h

    2024年02月19日
    浏览(67)
  • 《人工智能专栏》必读150篇 | 专栏介绍 & 专栏目录 & Python与PyTorch | 机器与深度学习 | 目标检测 | YOLOv5及改进 | YOLOv8及改进 | 关键知识点 | 工具

    各位读者们好,本专栏最近刚推出,限于个人能力有限,不免会有诸多错误,敬请私信反馈给我,接受善意的提示,后期我会改正,谢谢,感谢。 第一步 :[ 购买点击跳转 ] 第二步 : 代码函数调用关系图(全网最详尽-重要) 因文档特殊,不能在博客正确显示,请移步以下链接

    2024年02月02日
    浏览(71)
  • Java基础入门知识

    以下是学习java必备的知识 目录 前言 一、Java入门 二、基本数据类型与数组 标识符与 2. 基本数据类型 3. 类型转换运算 4. 运算符 5. 数组 6.控制结构(与c使用一致) 总结 Java语言是面向对象编程语言,编写的软件与平台无关。具有语法简单、面向对象、稳定、与平台无

    2024年02月16日
    浏览(63)
  • 第一讲:入门知识笔记

    python 变量无类型,但值里面有类型。 动态类型语言(pythonjavascript) Subtraction reverse 3-digit number 判断两个浮点数是否相等不能直接用== 运算优先级 operation precedence not and or 计算闰年 交换变量 name variable google.github.io/styleguide/pyguide.html python中的权限控制access control 默认成员变量

    2024年01月25日
    浏览(40)
  • TensorFlow入门知识

    TensorFlow是集齐了很多深度学习相关的算法的框架,你可以利用他搭建自己的神经网络模型。对于开发者来说,告诉TensorFlow一批特征数据和最终的答案数据,让其通过一个神经网络模型进行训练,最终输出模型。模型将应用于应用端,给他一个输入特征值,就能预测出一个答

    2024年02月08日
    浏览(38)
  • 认识Transformer:入门知识

    视频链接: https://www.youtube.com/watch?v=ugWDIIOHtPAlist=PLJV_el3uVTsOK_ZK5L0Iv_EQoL1JefRL4index=60 Seq2Seq RNN不容易被平行化 提出用CNN来代替RNN,CNN 可以平行化,但是需要的层数比较深,才能看完所有的输入内容。 Self-Attention layer b1 到b4 是可以同时被算出。 可以用来取代RNN。 来源: Attentio

    2024年02月12日
    浏览(37)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包