纯视觉都有哪些量产方案?单目3D感知在自动驾驶中的应用一览(3D检测/BEV/占用网络)

这篇具有很好参考价值的文章主要介绍了纯视觉都有哪些量产方案?单目3D感知在自动驾驶中的应用一览(3D检测/BEV/占用网络)。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

尽管基于点云的3D目标检测算法性能不断提升,在KITTI和Nuscenes等榜单上碾压视觉方案。但是激光雷达相对高昂的造价和对各种复杂天气情况的敏感性限制激光雷达的应用范围,使得研究人员更多的探索基于视觉的3D检测。

纯视觉都有哪些量产方案?单目3D感知在自动驾驶中的应用一览(3D检测/BEV/占用网络),单目3D,自动驾驶,人工智能

纯视觉的3D检测输入一般是单目图像或多目图像,只需要安装摄像头,标定相对简单,适合大规模的商业部署。而且,图像包含丰富的场景的颜色和纹理信息,有利于模型的检测和分类。目前量产方案中,像地平线,Mobileye和stradvision都是基于视觉的3D感知方案,而单目方案由于价格更具有优势,被广泛量产于各类车辆的L2~L4方案上。

纯视觉都有哪些量产方案?单目3D感知在自动驾驶中的应用一览(3D检测/BEV/占用网络),单目3D,自动驾驶,人工智能

纯视觉3D的学习路线

当前纯视觉3D方案主要包括多目BEV方案和单目3D/BEV方案。通常认为,视觉3D检测的发展路径是:2D车轮检测+地平假设->单目3D检测->BEV检测和occupancy检测。

纯视觉都有哪些量产方案?单目3D感知在自动驾驶中的应用一览(3D检测/BEV/占用网络),单目3D,自动驾驶,人工智能

如果想要更全面学习和理解纯视觉3D检测,需要认真将整个流程走一遍。

  • 2D车轮检测+地平假设,需要了解成熟的2D检测器,faster rcnn和CenterNet等,以及图像坐标系到相机坐标系再到车身坐标系的转换。

  • 单目3D检测,需要学习CenterNet3D,FCOS3D和DD3D等单目3D检测算法,单目3D的核心是如何通过相机的几何投影模型和3D投影点等先验,得到准确深度估计。另外,像DD3D等算法,借助lidar数据预训练使得模型具有深度感知能力。

  • 单目BEV检测,需要学习PETR,BEVDET和CaDNN等算法,学习如何把2D特征3D化,像CaDDN和BEVDET是借助深度估计网络。而PETR和BEVFormer是借助transformer来隐式做特征转换。

  • 单目Occupancy检测。需要学习VoxFormer, FB-OCC和MonoNeRD等算法。Occupancy模型输出3D空间的每个网格是否被占用。由于是在3D空间做运算,计算量大,如何设计轻量化的Occupancy网络值得研究。另外,现在的occupancy的标签是通过高线速的激光雷达,通过多帧叠加生成的,难以大规模商用,如何生成Occupancy的监督信号也是值得研究,像利用NeRF的3D重建来给Occupancy提供监督信号也是很好的方法。

由于涉及的内容较多,时间线较长,即使是已经有工作年限的同学,也很少能够完整的走一遍,更别说未有工作经验的同学。

如何学习?

针对领域主流的单目3D,单目BEV和单目Occupancy算法,我们自研了一套同时面向工程界和学术界的教程,针对目前常用的大模型自动标注、点云模型蒸馏视觉3D模型、CaDDN+BEVDet单目BEV方案、PETR单目BEV方案、单目Occupancy方案OccupancyM3D等展开详细介绍。

重点关注应用上的难点,同时也介绍了目前大火的BEV自动标注方案,真正能够带大家从0到1梳理清楚视觉3D方案的路线及核心内容点,最适合工作上需要进阶的同学以及刚入门的小白,大纲如下:

纯视觉都有哪些量产方案?单目3D感知在自动驾驶中的应用一览(3D检测/BEV/占用网络),单目3D,自动驾驶,人工智能

主讲老师

Wind, 就职于某头部自动驾驶公司,6年感知算法经验,主要关注视觉3D检测相关研发工作,致力于纯视觉3D感知和NeRF的学习和研究。曾在KITTI和Nuscenes上获得3D检测任务第一名,并在AAAI和WACV等顶会上发表论文多篇。

需要具备的基础

  • 具有一定的python和pyTorch基础,熟悉深度学习常用的一些基础算法;

  • 对BEV感知和单目3D、Occupancy的应用和基础方案有一定了解;

  • 一定的线性代数和矩阵论基础;

  • 电脑需要自带GPU,能够通过CUDA加速(显存至少6GB);

学后收获

  • 对量产级的单目3D方案有着深入理解,在数据标注、模型设计和优化上有较大提升;

  • 熟悉自动驾驶感知算法与方案的发展路线,从更高的角度上看待整个行业;

  • 能够精通自动驾驶通用算法,理论实践并重,无论是学术界抑或工业界都能直接复用;

  • 学完本课程能够达到1年左右的视觉3D感知算法工程师的水平;

  • 能够结识许多行业从业人员与学习合作伙伴!

开课时间与学习方式

历经两个月,离线视频授课。主讲老师在微信学习群内答疑,对课程中的算法、代码、环境配置等问题一一解惑!

课程咨询

纯视觉都有哪些量产方案?单目3D感知在自动驾驶中的应用一览(3D检测/BEV/占用网络),单目3D,自动驾驶,人工智能

扫码学习课程

纯视觉都有哪些量产方案?单目3D感知在自动驾驶中的应用一览(3D检测/BEV/占用网络),单目3D,自动驾驶,人工智能

扫码添加小助理咨询课程!

(微信:AIDriver004)文章来源地址https://www.toymoban.com/news/detail-841546.html

到了这里,关于纯视觉都有哪些量产方案?单目3D感知在自动驾驶中的应用一览(3D检测/BEV/占用网络)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【单目3D】在自动驾驶中将 2D 物体检测提升到 3D

    单目 3D 目标检测使用 RGB 图像来预测目标 3D 边界框。由于 RGB 图像中缺少关键的深度信息,因此该任务从根本上说是不适定的。然而在自动驾驶中,汽车是具有(大部分)已知形状和大小的刚体。那么一个关键的问题是如何有效地利用汽车的强大先验,在传统 2D 对象检测之上

    2024年02月19日
    浏览(37)
  • 超全 | 基于纯视觉Multi-Camera的3D感知方法汇总!

    近两年,基于纯视觉BEV方案的3D目标检测备受关注,all in one方式,确实能将基于camera的3D检测算法性能提升一大截,甚至直逼激光雷达方案,这次整理了领域中一些备受关注的multi-camera bev纯视觉感知方案,包括DETR3D、BEVDet、ImVoxelNet、PETR、BEVFormer、BEVDepth、BEVDet4D、BEVerse等!

    2023年04月08日
    浏览(43)
  • 3D视觉感知新SOTA BEVFormer复现nuscenes数据集测试demo

    0 写在前面 分享最近在BEV感知方面的工作,欢迎自动驾驶同行交流学习,助力自动驾驶早日落地。 1.概述 对于自动驾驶而言,BEV(鸟瞰图)下的目标检测是一项十分重要的任务。尽管这项任务已经吸引了大量的研究投入,但灵活处理自动驾驶车辆上安装的任意相机配置(单个

    2024年02月20日
    浏览(39)
  • 如何实现的手机实景自动直播,都有哪些功能呢?

    手机实景自动直播最近真的太火了,全程只需要一部手机,就能完成24小时直播带货,不需要真人出镜,不需要场地,不需要搭建直播间,只需要一部手机就可以了。真人语音讲解,真人智能回复,实时弹幕互动,完全就像是真人在直播。目前,这一种直播模式特别受到实体

    2024年02月10日
    浏览(38)
  • 【计算机视觉|人脸建模】PanoHead:360度几何感知的3D全头合成

    本系列博文为深度学习/计算机视觉论文笔记,转载请注明出处 标题: PanoHead: Geometry-Aware 3D Full-Head Synthesis in 360 ∘ ^{circ} ∘ 链接:[2303.13071] PanoHead: Geometry-Aware 3D Full-Head Synthesis in 360 ∘ ^{circ} ∘ (arxiv.org) 最近,在计算机视觉和计算机图形领域,对3D人头的合成和重建引起了

    2024年02月07日
    浏览(54)
  • 文献学习-37-动态场景中任意形状针的单目 3D 位姿估计:一种高效的视觉学习和几何建模方法

    Authors: Bin Li,† , Student Member, IEEE, Bo Lu,† , Member, IEEE, Hongbin Lin, Yaxiang Wang, Fangxun Zhong, Member, IEEE, Qi Dou, Member, IEEE and Yun-Hui Liu, Fellow, IEEE Source: IEEE TRANSACTIONS ON MEDICAL ROBOTICS AND BIONICS Keywords: Surgical Robotics, Pose Estimation, Geometry Modeling, Vision-based Manipulation Abstract: 导向图像的针具姿

    2024年04月17日
    浏览(42)
  • 基于工业互联网的RV1126+AI安防单目/双目高清视觉分析计数仪方案

    产品介绍 单目视觉分析计数器是信迈科技基于单目图像分析以及深度学习算法研发的一款区域统计计数器。它可以精确的识别监控区域内的物体,统计区域内停驻的人数/车辆等,也可以统计区域内进入以及离开人数。它可适用于公交车,大巴,商场,渡轮,景区等各种需要

    2024年02月07日
    浏览(46)
  • Talk预告 | 清华大学交叉信息研究院助理教授赵行:基于视觉感知的自动驾驶运动预测

    本期为 TechBeat人工智能社区 第 481 期 线上Talk! 北京时间 3 月15 日 (周三)20:00 , 清华大学交叉信息研究院助理教授—— 赵行 的Talk将准时在TechBeat人工智能社区开播! 他与大家分享的主题是:  “基于视觉感知的自动驾驶运动预测” ,届时将分享对一个基于视觉感知的、端到

    2023年04月14日
    浏览(44)
  • [工业3D] 主流的3D光学视觉方案及原理

    📢博客主页:https://loewen.blog.csdn.net 📢欢迎点赞 👍 收藏 ⭐留言 📝 如有错误敬请指正! 📢本文由 丶布布 原创,首发于 CSDN, 转载注明出处 🙉 📢现在的付出,都会是一种沉淀,只为让你成为更好的人✨ 一. 前言 传统工业机器视觉中, 3D 视觉与 2D 视觉技术的最大区别在

    2024年02月16日
    浏览(37)
  • 3D视觉之深度相机方案

    随着机器视觉,自动驾驶等颠覆性的技术逐步发展,采用 3D 相机进行物体识别,行为识别,场景 建模的相关应用越来越多,可以说 3D 相机就是终端和机器人的眼睛。 3D 相机又称之为深度相机,顾名思义,就是通过该相机能检测出拍摄空间的景深距离,这也是与普 通摄像头

    2023年04月21日
    浏览(44)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包