解读 | 自动驾驶系统中的多视点三维目标检测网络

这篇具有很好参考价值的文章主要介绍了解读 | 自动驾驶系统中的多视点三维目标检测网络。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

原创 | 文 BFT机器人 

解读 | 自动驾驶系统中的多视点三维目标检测网络,自动驾驶,目标检测,人工智能

01

背景

多视角三维物体检测网络,用于实现自动驾驶场景高精度三维目标检测,该网络使用激光雷达点云和RGB图像进行感知融合,以预测定向的三维边界框,相比于现有技术,取得了显著的精度提升。同时现代自动驾驶汽车通常配备多个传感器,如雷达和相机,激光扫描仪具有精确的深度信息,而相机保留了更详细的语义信息,激光雷达点云和RGB图像的融合应该能够实现更高的性能和安全性。本文提出并设计了一个深度融合方案结合多视图的区域特征,实现不同路径的中间层交互。

02

理论研究

在本文中提出的一种多视点三维物体检测网络(MV3D),该网络以多模态数据为输入,并预测了三维空间中物体的全三维范围。利用多模态信息的主要思想是进行基于区域的特征融合。首先提出了一种多视图编码方案,以获得稀疏三维点云的紧凑有效表示。三维提案网络利用点云的鸟瞰图表示来生成高精度的三维候选框。3D对象建议的好处是它可以投影到三维空间的任何视图中。多视图融合网络通过将三维建议从多个视图投影到特征图上来提取区域特征。深度融合的方法使得来自不同视图的中间层能够进行交互。本文在采用多视图特征表示的情况下,该网络进行定向三维盒回归,可以准确地预测三维空间中物体的三维位置、大小和方向。

解读 | 自动驾驶系统中的多视点三维目标检测网络,自动驾驶,目标检测,人工智能

图1 多视点三维目标检测网络

图像中的三维对象检测,是基于图像的方法通常依赖于精确的深度估计或地标检测。我们的工作展示了如何合并激光雷达点云来改进三维定位。并且在自动驾驶的环境中,利用多种数据模式的工作很少,我们的网络与它们不同,它对每个列使用相同的基础网络,并添加辅助路径和损失进行正则化。

解读 | 自动驾驶系统中的多视点三维目标检测网络,自动驾驶,目标检测,人工智能

图2 MV3D网络中输入的图片

对于MV3D网络,文中介绍了如何从鸟瞰图表示的点云中高效地生成3D物体候选框。不仅使用了一个基于卷积神经网络的物体候选框生成器,该生成器可以从鸟瞰图中提取出物体的候选框。

为了提高检测精度,还使用了一种基于锚的方法,即将一些预定义的3D 锚框与鸟瞰图中的像素点对应起来,从而生成更加准确的物体候选框。此外,为了解决物体候选框过小的问题,作者还使用了特征图上采样的方法,将特征图的分辨率提高一倍,从而使得物体候选框更加准确。同时也介绍了如何将来自多个视角的特征进行融合,以提高物体检测的精度和鲁棒性。具体来说,文中使用了一种深度融合方案,即将来自不同视角的特征进行逐层融合,从而使得网络可以更好地利用多视角信息。

此外,为了增强不同路径之间的交互,作者还使用了一种特殊的跨路径连接方式,即将不同路径的中间层进行交互,从而使得网络可以更好地利用不同路径之间的信息。

解读 | 自动驾驶系统中的多视点三维目标检测网络,自动驾驶,目标检测,人工智能

图3 本文提出的基于区域的融合网络的训练策略

03

实验与分析

本文提出的方法在基于激光雷达的2D检测方法中,在硬设置中比最近提出的Vote3Deep方法高出14.93%的精度。然而,值得注意的是,在2D检测方面,基于图像的方法通常比基于激光雷达的方法表现更好,因为它们直接优化2D盒子,而基于雷达的方法优化3D盒子。尽管如此,与最先进的二维检测方法相比,文章中的方法仍然获得了有竞争力的结果。

解读 | 自动驾驶系统中的多视点三维目标检测网络,自动驾驶,目标检测,人工智能

解读 | 自动驾驶系统中的多视点三维目标检测网络,自动驾驶,目标检测,人工智能

图4 实验模型在KITTI数据集上的检测和消融实验结果比较

文中提出设计为稳健而高效,可以处理复杂的场景,如遮挡和杂乱的环境,这种用于道路场景中三维目标检测的多视角感觉融合模型。我们的模型同时利用了激光雷达点云和图像,通过生成三维提案并将它们投影到多个视图中以进行特征提取来对齐不同的模式。总体而言,本文中的自动驾驶多视角三维物体检测网络是提高自动驾驶场景下物体检测精度和鲁棒性的有前途的方法。

END

作者 | 小雨点

排版 | 小河

审核 | 猫

若您对该文章内容有任何疑问,请与我们联系,我们将及时回应。文章来源地址https://www.toymoban.com/news/detail-723158.html

到了这里,关于解读 | 自动驾驶系统中的多视点三维目标检测网络的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • GaussDB技术解读系列:运维自动驾驶探索

    近日,在第14届中国数据库技术大会(DTCC2023)的 GaussDB“五高两易”核心技术,给世界一个更优选 择 专场,华为云数据库运维研发总监李东详细解读了GaussDB运维系统自动驾驶探索和实践。 随着企业数字化转型进入深水区,数据库系统越来越复杂,运维团队维护的数据库规模

    2024年02月07日
    浏览(42)
  • 用于自动驾驶最优间距选择和速度规划的多配置二次规划(MPQP) 论文阅读

    论文链接:https://arxiv.org/pdf/2401.06305.pdf 论文题目 :用于自动驾驶最优间距选择和速度规划的多配置二次规划(MPQP) 1 摘要 本文介绍了用于自动驾驶最优间距选择和速度规划的多配置二次规划(MPQP)。平滑且安全的路径规划对于自动驾驶汽车的成功部署是至关重要的。本文

    2024年01月19日
    浏览(57)
  • 自动驾驶算法 -撞前预警论文解读与项目应用

    特斯拉自动驾驶 深度估计,就是获取图像中场景里的每个点到相机的距离信息,这种距离信息组成的图我们称之为深度图,英文叫Depth map 一、backbone提取 代码实现: 二、差异特征提取 代码实现: 三、权重操作标准化 代码实现: 四、网络结构ASPP(空洞卷积) 代码实现 五、

    2024年02月10日
    浏览(32)
  • Mediapipe实时3D目标检测和跟踪(自动驾驶实现)

    3D目标检测是根据物体的形状、位置和方向来识别和定位物体的任务。在2D目标检测中,被检测到的物体仅表示为矩形边界框。3D目标检测任务通过预测物体周围的包围框,可以获取物体的三维位置信息。 3D目标检测在各行各业都有广泛的应用。一些常见的用途包括: 🎯 机器

    2024年02月09日
    浏览(30)
  • 51-2 万字长文,深度解读端到端自动驾驶的挑战和前沿

    去年初,我曾打算撰写一篇关于端到端自动驾驶的文章,发现大模型在自动驾驶领域的尝试案例并不多。遂把议题扩散了一点,即 从大模型开始,逐渐向自动驾驶垂直领域靠近,最后落地到端到端。 这样需要阐述的内容就变成LLM基础模型、LLM+自动驾驶以及端到端自动驾驶核

    2024年02月20日
    浏览(34)
  • 基于 Transformation-Equivariant 的自动驾驶 3D 目标检测

    论文地址:https://arxiv.org/abs/2211.11962 论文代码:https://github.com/hailanyi/TED 三维场景中的物体分布有不同的方向。普通探测器不明确地模拟旋转和反射变换的变化。需要大的网络和广泛的数据增强来进行鲁棒检测。 equivariant networks 通过在多个变换点云上应用共享网络显式地模拟

    2024年02月09日
    浏览(35)
  • 用于自动驾驶的基于深度学习的图像 3D 目标检测:综述

    论文地址:https://ieeexplore.ieee.org/abstract/document/10017184/ 准确、鲁棒的感知系统是理解自动驾驶和机器人驾驶环境的关键。自动驾驶需要目标的 3D 信息,包括目标的位置和姿态,以清楚地了解驾驶环境。 摄像头传感器因其颜色和纹理丰富且价格低廉而广泛应用于自动驾驶中。摄

    2024年02月03日
    浏览(44)
  • PSEUDO-LIDAR++:自动驾驶中 3D 目标检测的精确深度

    论文地址:PSEUDO-LIDAR++: ACCURATE DEPTH FOR 3D OBJECT DETECTION IN AUTONOMOUS DRIVING 论文代码:https://github.com/mileyan/Pseudo_Lidar_V2 3D 检测汽车和行人等物体在自动驾驶中发挥着不可或缺的作用。现有方法很大程度上依赖昂贵的激光雷达传感器来获取准确的深度信息。虽然最近推出了伪激光雷

    2024年01月23日
    浏览(38)
  • 目标检测YOLO实战应用案例100讲-基于改进YOLOv4算法的自动驾驶场景 目标检测

    目录 前言 国内外目标检测算法研究现状  传统目标检测算法的发展现状 

    2024年02月06日
    浏览(43)
  • 论文阅读综述:自动驾驶感知的多模态传感器融合Multi-modal Sensor Fusion for Auto Driving Perception: A Survey

    题目 :Multi-modal Sensor Fusion for Auto Driving Perception: A Survey 用于自动驾驶感知的多模态传感器融合:综述 链接 :https://arxiv.org/abs/2202.02703 只翻译了个人认为比较重要的东西,有些官方话就省了。这篇文章通俗易懂,不过综述都是标记文献[xx]干了啥,其实咱也不知道他具体是咋

    2023年04月08日
    浏览(42)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包