AI一叶知秋:从目标检测部署浅谈人工智能发展

这篇具有很好参考价值的文章主要介绍了AI一叶知秋:从目标检测部署浅谈人工智能发展。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

笔者写这篇文章也有讨巧之嫌,仅以个人视角分享一些看法,主要从实践部署来谈谈近两年来计算机视觉模型的变化,不过AI是一个宏大的话题,每个人定义的人工智能就不一样,我们先来探讨一下何为人工智能。百度百科中是这样定义的:

人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。

而我又询问了文心一言和GPT,文心一言回答得更加全面,补充了百科中模糊的部分,而GPT从自身角度回答了什么是人工智能。

文心一言:人工智能的基本原理是通过算法和模型来模拟人类的智能行为。算法是计算机程序执行任务所遵循的一组规则和指令。模型则是基于数据和算法构建的,用于模拟人类智能行为的系统或平台。通过训练和优化模型和算法,人工智能系统可以逐渐学习和掌握各种复杂的任务和技能,从而实现自主决策和行动。人工智能的应用非常广泛,例如:

  1. 机器学习:通过训练大量数据来使计算机自主地进行决策和预测。
  2. 自然语言处理:使计算机能够理解和生成人类语言。
  3. 计算机视觉:使计算机能够解释和理解图像和视频。
  4. 语音识别:将人类的语音转换为文本或命令。
  5. 专家系统:在特定领域内提供类似人类专家的建议和决策支持。
  6. 机器人技术:设计和制造能够自主行动和决策的机器人。

GPT:作为一个人工智能,我被设计用来处理和理解大量的信息,并且可以执行特定任务。人工智能是指通过模拟人类智力的技术来实现某种形式的感知、学习、推理和决策能力。这些技术包括机器学习、深度学习、自然语言处理等,使得计算机系统能够展现出类似于人类的智能行为。 

可以看到有些关键词重复出现了多次,如模型、模拟、能力,那我们简单抽象得出一个概念:人工智能的就是用算法模型来模拟人类能力,那么它的发展趋势也就是接近人甚至超越人。尽管我认为人工智能的含义应该包揽所有的自动化智能化,乃至一切通过电路、信号来便利生活的产物。但不得不说在这个抽象化的概念下,神经网络或者更具体的卷积神经网络完美契合了这几个关键词,至少从字面以上来看,像是一个仿生学词汇,而我们刚才得出的结论,人工智能不就是模仿人的行为吗。 

所以神经网络衍生出的几个研究领域自然成为了人工智能的大热门,例如计算机视觉、自然语言处理、深度强化学习等。近几年来不断更迭,推陈出新,在各大媒体平台都能看见这几位的身影,然而现在我要泼一盆凉水,就拿我从事过的目标检测来说,对比GPT这类成功的自然语言处理工具,在实用性上还有很长的路要走。

我的工作是部署目标检测模型来识别灯条和数字,相较于各种人脸识别地图识别来说比较简单,先前我也写过一篇文章记叙了目标检测模型的发展,详见

而我刚开始学习目标检测时接触到的并不是文中的Region-CNN或是Overfeat模型,而是百度飞桨上的手写数字识别MNIST数据集,许多项目都是围绕着这个数据集建立模型,或者说不上建立,更像是自己凭感觉修改成熟架构的几个参数然后不断微调,当然初学者更多是照搬原模型,我记得自己用vgg16跑了很多次数字识别,后来又试过resnet50,即使始终不会调参,但是创建数据集并用各种标注软件画框却练得炉火纯青。那时候SOTA模型还没有那么深入人心,最开心的事情就是在colab上对网络一通瞎搞碰巧提高了准确率。

后来为了速度和精确接触了YOLO系列,从v3,v5再到v8,效果越来越好,但是部署的难度也在提升。就拿resnet来说,作为一个18层的小模型,使用CPU速度就足够了,但是对于YOLO来说,帧率可能只有十几hz,不用说商业化,仅是在robomaster赛场都不堪重用。于是CUDA、Tensorrt等加速软硬件就显得格外重要,那时候还研究过英伟达的NCS和谷歌的TPU,感觉并不怎么合适。

我们面临的最重要的一个问题是大家都是编写一个py文件然后装上GPU驱动跑数据,很少有人真的把模型封装在一个单片机里,然后加上足够多的外设,就像终结者里面能跑能跳自动追踪的机器人一样。所以训练好了模型,怎么部署就令人头疼。我们先是将pth文件通过Protobuf序列化成onnx文件,再使用NVIDIA的API转为engine,在这之后根据github上开源的一些仓库创建了接口,使得图像数据可以送达至模型并输出结果。这个过程还要创建编写py、json、txt、xml、h、cu、cpp、wts等一大堆眼花缭乱的文件,最后的结果也不一定稳定,可能外接的相机光圈有些变化就会报出一串error。

所以说尽管模型的架构不断完善,许多云平台或者是开源仓库让一窍不通的小白也能顺利完成训练并得到满意的结果,我仍然持有一个审慎的看法,先前在小木虫有看到过一个类似的帖子,大意是各大厂商不断发力纷纷推出自家的SOTA模型,但是研究生除了根据这些模型改改参数更加贴近外,是做不了实际工业项目的,他们实验室里有一个祖传横向是一个图像分割的传送带监控,用的还是七八年前的模型,因为既没有人关注这些不随大流发展人机对话而是负责特定用途的小众模型,也没有人想要优化一个需要连接电路处理信号避免干扰的实际部署器件。这实际上就反映了深度学习能否真正发挥效用的进一步难题——当大家都飞在云端时,有没有人愿意停下来回到地面呢。文章来源地址https://www.toymoban.com/news/detail-787277.html

到了这里,关于AI一叶知秋:从目标检测部署浅谈人工智能发展的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 迈向多模态AGI之开放世界目标检测 | 人工智能

    作者: 王斌 谢春宇 冷大炜 引言 目标检测是计算机视觉中的一个非常重要的基础任务,与常见的的图像分类/识别任务不同,目标检测需要模型在给出目标的类别之上,进一步给出目标的位置和大小信息,在CV三大任务(识别、检测、分割)中处于承上启下的关键地位。当前

    2024年02月16日
    浏览(33)
  • 人工智能 - 目标检测:发展历史、技术全解与实战

    本文全面回顾了目标检测技术的演进历程,从早期的滑动窗口和特征提取方法到深度学习的兴起,再到YOLO系列和Transformer的创新应用。通过对各阶段技术的深入分析,展现了计算机视觉领域的发展趋势和未来潜力。 关注TechLead,分享AI全维度知识。作者拥有10+年互联网服务架

    2024年02月05日
    浏览(25)
  • 人工智能TensorFlow PyTorch物体分类和目标检测合集【持续更新】

    1. 基于TensorFlow2.3.0的花卉识别 基于TensorFlow2.3.0的花卉识别Android APP设计_基于安卓的花卉识别_lilihewo的博客-CSDN博客 2. 基于TensorFlow2.3.0的垃圾分类 基于TensorFlow2.3.0的垃圾分类Android APP设计_def model_load(img_shape=(224, 224, 3)_lilihewo的博客-CSDN博客   3. 基于TensorFlow2.3.0的果蔬识别系统的

    2024年02月09日
    浏览(34)
  • 基于人工智能与边缘计算Aidlux的鸟类检测驱赶系统(可修改为coco 80类目标检测)

    ●项目名称 基于人工智能与边缘计算Aidlux的鸟类检测驱赶系统(可修改为coco 80类目标检测) ●项目简介 本项目在Aidlux上部署鸟类检测驱赶系统,通过视觉技术检测到有鸟类时,会进行提示。并可在源码上修改coco 80类目标检测索引直接检测其他79类目标,可以直接修改、快速

    2024年02月12日
    浏览(41)
  • YOLO目标检测——真实和人工智能生成的合成图像数据集下载分享

    YOLO真实和人工智能生成的合成图像数据集,真实场景的高质量图片数据,图片格式为jpg,数据场景丰富。可用于检测图像是真实的还是由人工智能生成。 数据集点击下载 :YOLO真实和人工智能生成的合成图像数据集+120000图片+数据说明.rar

    2024年02月10日
    浏览(32)
  • 人工智能学习与实训笔记(三):神经网络之目标检测问题

    人工智能专栏文章汇总:人工智能学习专栏文章汇总-CSDN博客 目录 三、目标检测问题 3.1 目标检测基础概念 3.1.1 边界框(bounding box) 3.1.2 锚框(Anchor box) 3.1.3 交并比 3.2 单阶段目标检测模型YOLOv3 3.2.1 YOLOv3模型设计思想 3.2.2 YOLOv3模型训练过程 3.2.3 如何建立输出特征图与预

    2024年02月20日
    浏览(34)
  • 浅谈AI人工智能ChatGpt提升竞彩足球分析准确率最高的分析软件

    随着科技的不断进步,人工智能正在扮演着越来越重要的角色。在体育领域,特别是足球竞猜中,AI人工智能ChatGpt正以其卓越的分析能力引起了广泛的关注。作为一款以大数据分析为基础的分析软件,AI人工智能ChatGpt不仅可以提供准确的数据预测,还能帮助用户提高竞彩足球

    2024年02月10日
    浏览(33)
  • 人工智能学习07--pytorch15(前接pytorch10)--目标检测:FPN结构详解

    backbone:骨干网络,例如cnn的一系列。(特征提取) (a)特征图像金字塔 检测不同尺寸目标。 首先将图片缩放到不同尺度,针对每个尺度图片都一次通过算法进行预测。 但是这样一来,生成多少个尺度就要预测多少次,训练效率很低。 (b)单一特征图 faster rcnn所采用的一种方式

    2023年04月12日
    浏览(34)
  • 人工智能学习07--pytorch20--目标检测:COCO数据集介绍+pycocotools简单使用

    如:天空 coco包含pascal voc 的所有类别,并且对每个类别的标注目标个数也比pascal voc的多。 一般使用coco数据集预训练好的权重来迁移学习。 如果仅仅针对目标检测object80类而言,有些图片并没有标注信息,或者有错误标注信息。所以在实际的训练过程中,需要对这些数据进行

    2024年02月12日
    浏览(35)
  • 毕业设计:基于机器学习的课堂学生表情识别系统 人工智能 python 目标检测

    目录 前言 项目背景 数据集 设计思路 更多帮助     📅大四是整个大学期间最忙碌的时光,一边要忙着备考或实习为毕业后面临的就业升学做准备,一边要为毕业设计耗费大量精力。近几年各个学校要求的毕设项目越来越难,有不少课题是研究生级别难度的,对本科同学来说是充

    2024年04月16日
    浏览(41)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包