什么是目标检测?有哪些应用?终于有人讲明白了

这篇具有很好参考价值的文章主要介绍了什么是目标检测?有哪些应用?终于有人讲明白了。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

导读:计算机视觉(Computer Vision,CV)是一门教计算机如何“看”世界的学科。计算机视觉包含多个分支,其中图像分类、目标检测、图像分割、目标跟踪等是计算机视觉领域最重要的研究课题。本文将着重介绍目标检测的相关知识,并提供一些实例,以帮助读者对目标检测建立一个整体的认识。

作者:涂铭 金智勇

来源:大数据DT(ID:hzdashuju)

01 什么是目标检测

本文讨论的目标检测是指通过编写特定的算法代码,让计算机从一张图像中找出若干特定目标的方法。目标检测包含两层含义:

  1. 判定图像上有哪些目标物体,解决目标物体存在性的问题;

  2. 判定图像中目标物体的具体位置,解决目标物体在哪里的问题。

目标检测和图像分类最大的区别在于目标检测需要做更细粒度的判定,不仅要判定是否包含目标物体,还要给出各个目标物体的具体位置。如图1-1所示,目标检测算法关注的是“人体”这一特定目标物体,图像中不但检测出了两个小朋友(人体),还准确地框出了两个小朋友在图像中的位置。

什么是目标检测?有哪些应用?终于有人讲明白了

▲图1-1 人体检测示例

02 典型的应用场景

目标检测是计算机视觉最基本的问题之一,具有极为广泛的应用,下面简单介绍几个典型的应用场景。

1. 人脸识别

人脸识别是基于人的面部特征进行身份识别的一种生物识别技术,通过采集含有人脸的图像或视频流,自动检测和跟踪人脸,进而对检测到的人脸进行识别,通常也叫作人像识别、面部识别。

人脸识别系统主要包括4个部分,分别为人脸图像采集/检测、人脸图像预处理、人脸图像特征提取以及身份匹配与识别。其中人脸图像采集/检测是进行后续识别的基础。如图1-2所示,通过检测框把后续识别算法的处理区域从整个图像限制到人脸区域。

什么是目标检测?有哪些应用?终于有人讲明白了

▲图1-2 人脸识别示例

近年来,人脸识别技术已经取得了长足的发展,目前广泛应用于公安、交通、支付等多个实际场景。

2. 智慧交通

智慧交通是目标检测的一个重要应用领域,主要包括如下场景。

  1. 交通流量监控与红绿灯配时控制:通过视觉算法,对道路卡口相机和电警相机中采集的视频图像进行分析,根据相应路段的车流量,调整红绿灯配时策略,提升交通通行能力。

  2. 异常事件检测:通过视觉算法,检测各种交通异常事件,包括非机动车驶入机动车道、车辆占用应急车道以及监控危险品运输车辆驾驶员的驾驶行为、交通事故实时报警等,第一时间将异常事件上报给交管部门。

  3. 交通违法事件检测和追踪:通过视觉算法,发现套牌车辆、收费站逃费现象,跟踪肇事车辆,对可疑车辆/行人进行全程轨迹追踪,通过视觉技术手段,极大地提升公安/交管部门的监管能力。

  4. 自动驾驶:自动驾驶是当今热门的研究领域,是一个多种前沿技术高度交叉的研究方向,其中视觉相关算法主要包含对道路、车辆以及行人的检测,对交通标志物以及路旁物体的检测识别等。主流的人工智能公司都投入了大量的资源进行自动驾驶方面的研发,目前已经初步实现了受限路况条件下的自动驾驶,但距离实现不受路况、天气等因素影响的自动驾驶(L4级别),尚有相当大的一段距离。

从根本上看,交通场景中各种具体应用的底层实现,都是以目标检测技术为基础的,即对道路、车辆以及行人进行检测。

3. 工业检测

工业检测是计算机视觉的另一个重要应用领域,在各个行业均有极为广泛的应用。在产品的生产过程中,由于原料、制造业工艺、环境等因素的影响,产品有可能产生各种各样的问题。其中相当一部分是所谓的外观缺陷,即人眼可识别的缺陷。

图1-3是电路板内层芯板断路示意图,明显可以看出图中铜导线有一个断开的部分。

什么是目标检测?有哪些应用?终于有人讲明白了

▲图1-3 电路板内层芯板断路示意图

在传统生产流程中,外观缺陷大多采用人工检测的方式进行识别,不仅消耗人力成本,也无法保障检测效果。工业检测就是利用计算机视觉技术中的目标检测算法,把产品在生产过程中出现的裂纹、形变、部件丢失等外观缺陷检测出来,达到提升产品质量稳定性、提高生产效率的目的。

关于作者:涂铭,资深数据架构师和人工智能技术专家,现就职于腾讯,曾就职于阿里。对大数据、自然语言处理、图像识别、Python、Java等相关技术有深入的研究,积累了丰富的实践经验。

金智勇,计算机视觉算法专家,在计算机视觉领域深耕12年。现就职于百度,曾就职于阿里和三星等知名高新技术企业。业务领域涵盖增强现实、人脸识别、图像美化、智能交通、工业质检等多个方向,具有丰富的算法研究与落地经验。

本文摘编自《深度学习与目标检测:工具、原理与算法》,经出版方授权发布。(ISBN:9787111690344)

什么是目标检测?有哪些应用?终于有人讲明白了

《深度学习与目标检测:工具、原理与算法》

点击上图了解及购买

转载请联系微信:DoctorData

推荐语:AI和计算机视觉专家在阿里、腾讯、百度经验总结,工具、原理、算法3维度快速入门目标检测,附源数据和代码。

什么是目标检测?有哪些应用?终于有人讲明白了

划重点👇

干货直达👇

  • 收藏!数据分析、人工智能、产品经理等6个方向学习路线图及参考书目

  • 盘点云原生的5大特征

  • 终于有人把云计算与数据库的关系讲明白了

  • 解决卡脖子问题:盘点中国工业软件产业细分领域市场格局

更多精彩👇

在公众号对话框输入以下关键词

查看更多优质内容!

读书 | 书单 | 干货 讲明白 | 神操作 | 手把手

大数据 | 云计算 | 数据库 | Python | 爬虫 | 可视化

AI | 人工智能 | 机器学习 | 深度学习 | NLP

5G | 中台 | 用户画像 数学 | 算法 数字孪生

据统计,99%的大咖都关注了这个公众号

👇文章来源地址https://www.toymoban.com/news/detail-423335.html

到了这里,关于什么是目标检测?有哪些应用?终于有人讲明白了的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 云计算与数字化转型的关系,终于有人讲明白了

    导读: 云计算与数字化转型是相辅相成的关系。 作者:阿里云智能-全球技术服务部 来源:大数据DT(ID:hzdashuju) 01 云计算带来的重大变化 通过数据提升效率、降低成本、进行业务创新,这个想法不是第一天出现,在大型机、小型机时代就已经出现了这种观点。那个时候,

    2024年01月25日
    浏览(34)
  • 终于有人把大数据、云计算技术架构与实践技术讲明白了

    大数据云计算正在快速发展,相关技术热点也呈现百花齐放的局面,业界各大厂商纷纷制定相应的战略,新的概念、观点和产品不断涌现。 大数据和云计算作为新一代IT技术变革的核心,必将成为广大学生、科技工作者构建自身IT核心竞争能力的战略机遇。因而作为高层次IT人才,学

    2024年04月11日
    浏览(46)
  • 到底什么是机器学习模型?这篇文章终于讲明白了

    机器学习 (Machine Learning) 是对研究问题进行模型假设,利用计算机从训练数据中学习得到模型参数,并最终对数据进行预测和分析的一门学科。 **模型是机器学习的核心组成要素。**本文从模型的广义概念出发,引申出机器学习模型的基本定义,并就机器学习中容易混淆的概念

    2024年02月05日
    浏览(35)
  • 终于有人将TWI(串行通讯接口)给讲通了!

    目录 TWI的特性 数据传输格式  时钟同步  数据仲裁 功能描述  总线接口单元 频率生成单元 地址匹配单元 控制单元 传输模式 主机发送模式  主机接收模式  从机发送模式  从机接收模式 两线模式,简单快捷; 支持主机模式和从机模式; 允许发送数据和接收数据; 支持多

    2024年02月13日
    浏览(27)
  • 终于有人把VMware虚拟机三种网络模式讲清楚了!

    你们好,我的网工朋友。 前段时间 VMware 更新了,你用上最新版了吗? 有几个网工朋友留言说,在操作中遇到过各种各样的问题。比如说由于公司服务器重启导致出现下面的问题: 在Xshell里连接虚拟机映射时连接失败;能够连接上虚拟机的映射地址,但git pull时报错无法解析

    2024年02月06日
    浏览(29)
  • 用了这么多年Rust终于搞明白了内存分布!

    Rust作为一门学习曲线十分陡峭的语言,掌握其核心基础数据结构的内存分布对学习Rust会有很大的帮助,即使对于已经熟悉Rust的同学,深入数据结构分布也能帮助到调优Rust程序。 接下来,我会由浅入深仔细介绍Rust的各个数据结构在内存中的分布情况,帮助大家学习Rust。 先

    2024年02月02日
    浏览(37)
  • Spring使用三级缓存解决循环依赖?终于完全弄明白了

    文章阅读前推荐 推荐先去看看源码,源码很短,但是对于我们在脑子里构建一个完整思路很重要。看起来非常简单,只需要双击shift,全局查找文件:AbstractAutowireCapableBeanFactory,找到550行左右的doCreateBean方法,重点看一下580行到600行这20行代码就行,包含了三级缓存、属性注

    2024年03月25日
    浏览(30)
  • vue开发者vite多环境配置,终于搞明白了

    在看项目的过程中,发现有类似服务端多环境配置的配置,所以研究了下,在网上有多个方案,选了一个当前在用的吧,另外一个没验证 对于使用Vite构建的Vue项目,可以使用Vite提供的环境变量来实现多环境配置。 Vite 使用  dotenv  从  环境文件目录  中加载环境文件,默认

    2024年02月06日
    浏览(29)
  • 熬夜搞了 17000 字,终于把你这个 ES 玩明白了

    平常经常用ES(ElasticSearch), 觉得这真是个好玩意儿,所以来分享一篇文章,希望通过这篇文章能让读者大致了解ES是做什么的以及它的使用和基本原理。 可能有的读者航海不知道ES是个啥玩儿,别着急,看完本文后,相信你会了解ES, 对ES的理解也会更加深刻。希望大家在合适的

    2024年02月10日
    浏览(28)
  • 我用两个月时间,终于把CSDN付费资源项目玩明白了!

    关于项目的定位,这是一个知识付费项目,根据市场研究机构的数据显示,到2023年,全球知识付费市场规模将达到2000亿美元,所以说知识付费的前景是十分广阔的,当下互联网时代信息大爆炸,80后、90后、00后群体对知识付费的认可度也大幅提升,同时这群作为知识付费的主流

    2024年02月14日
    浏览(23)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包