经典文献阅读之--Calib Anything(使用SAM的无训练标定雷达相机外参)

这篇具有很好参考价值的文章主要介绍了经典文献阅读之--Calib Anything(使用SAM的无训练标定雷达相机外参)。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

0. 简介

Camera与LiDAR之间的外部标定研究正朝着更精确、更自动、更通用的方向发展,由于很多方法在标定中采用了深度学习,因此大大减少了对场景的限制。然而,数据驱动方法具有传输能力低的缺点。除非进行额外的训练,否则它无法适应数据集的变化。随着基础模型的出现,这个问题可以得到显著缓解,通过使用分割任意模型(Segment Anything Model,SAM),我们这次提出了一种新的激光雷达相机标定方法,该方法不需要额外的训练,并适用于常见场景。相关的代码可以在Github上获得。


1. 主要贡献

首先使用SAM对整个图像进行语义分割,得到一组掩码,在没有在点云和掩模之间建立明确的对应关系,而是计算掩模内点云属性的一致性,包括其强度、法向量和分割类。如图1所示,在正确的外在条件下,汽车mask内点的强度具有更高的一致性。对于法线向量,plane masks上的点应具有一致的法线方向,简单地通过平面拟合和欧氏聚类得到点云的分割类。vehicles和trunks 等目标将聚集在一个类别中,因此mask上也具有一致性!论文计算了具有这三个属性的每个mask的一致性得分,通过给出一个初始的外在值,可以通过最大化所有mask的总分来优化它。

sam calib,深度学习,数码相机

图1. 通过正确的外参(a)和错误的外参(b)投影到车的掩模上的点云。点的颜色表示强度值。


为此,本文主要工作的贡献如下:

1)我们提出了一种新颖的自动LiDAR-相机外参校准方法,使用SAM和点云一致性,不需要额外的训练。

2)外参参数的优化标准是点云在掩模上的强度、法线向量和分割类别的一致性,使我们的方法适用于大多数场景。

3)我们在多个数据集上验证了我们的方法,证明了其通用性和可比性精度。


2. 方法概述

整个过程可以分为三个部分。对于图像分割,我们使用SAM生成整个图像的掩模。对于点云,我们实现了法线估计、简单的分割方法和强度归一化,以生成每个点的对应属性。然后,优化目标是使落在一个掩模上的点具有接近的属性值。我们设计了一个评估一致性的得分函数。进行几轮搜索以获得最终结果。图2显示了我们提出的方法的流程。

sam calib,深度学习,数码相机

图2. 方法概述。对于图像,使用Segment Anything模型生成整个图像的掩码。对于点云,我们实现了法线估计、简单的分割方法和强度归一化,以生成每个点的相应属性。在优化阶段,通过外参将点云投影到掩码上。我们设计了一个损失函数,该函数由掩码区域内点的属性一致性决定。

3. 数据预处理

3.1 图像分割

首先在整个图像上应用SAM,以获取许多不同对象的掩模。由于我们使用点云的一致性,我们希望分割更加细致和详细。因此,我们调整SAM的超参数以获得更多的掩模,并减少重叠区域。这些掩模被注释为 M = { M i ∣ i = 0 , 1 , … , N } \mathbb{M} = \{M_i | i = 0, 1, …, N\} M={Mii=0,1,,N}。每个掩模是一个与图像相同大小的二进制矩阵。值 M i ( u , v ) = { 0 , 1 } M_i(u, v) = \{0, 1\} Mi(u,v)={0,1}表示像素 ( u , v ) (u, v) (u,v)是否属于第 i i i个分割。

3.2 点云预处理

预处理有三个部分:法线估计、强度归一化和分割

对于法线估计,有许多方法[32],[33]可以直接使用。在这里,我们选择了一个简单的方法,足以满足我们的应用需求。表面上的一个点的法线方向被近似为与表面相切的平面的法线。平面法线可以通过分析由查询点的一些最近邻创建的协方差矩阵的特征向量和特征值或主成分分析(PCA)来估计。使用K-d树数据结构进行高效的k最近邻(KNN)搜索。

点云的强度通过比例因子进行归一化,以便在点云的强度根据LiDAR类型不同而不同的情况下进行后续的一致性计算。

除了这两个属性之外,我们对点云进行简单的分割方法。我们首先通过RANSAC算法进行平面拟合,提取场景中的大型平面,如地面和墙壁。然后我们对剩余的点云应用一些欧几里得聚类[32],并获得个体对象的聚类,如车辆和树木。我们为点分配一个数字 c c c,表示它属于哪个类别。 点云中点的最终属性可以表示为:

sam calib,深度学习,数码相机

这是点 P P P的位置、法线向量、反射率和分割类别。

3.3 外参优化 (重点内容)

1)一致性函数: 点 p p p可以通过初始外参 T T T投影到图像帧中:

sam calib,深度学习,数码相机

在这里,我们假设内参 K K K已知。然后对于每个掩模 M i M_i Mi,我们可以得到一组落在其上的点:

sam calib,深度学习,数码相机

可以通过以下公式计算点集 P i P_i Pi的一致性得分:

sam calib,深度学习,数码相机

其中, F R ( ⋅ ) 、 F N ( ⋅ ) 、 F S ( ⋅ ) F_R(·)、F_N(·)、F_S(·) FR()FN()FS()是反射率、法线向量和分割类别的对应函数, w R w_R wR w N w_N wN w S w_S wS是它们的权重。在实践中,我们使用 w R = w N = w S w_R = w_N = w_S wR=wN=wS f ( ⋅ ) f(·) f()是根据Pi中点的数量进行调整的函数。 反射率一致性可以通过所有值的标准差(std)简单计算

sam calib,深度学习,数码相机

假设大小为(3 × n)的矩阵 A A A P i P_i Pi中的法线向量组成。法线向量的一致性函数 F N F_N FN表示为:

sam calib,深度学习,数码相机

它是所有**向量成对点积的平均值。对于分割类别,首先对每个类别的点进行计数并按从大到小的顺序排序。**这表示为 ( c 0 , c 1 , … ) (c_0,c_1,…) (c0c1),其中 c i c_i ci是第 i i i个最大类别中的点数。一致性是所有类别的加权和:

sam calib,深度学习,数码相机文章来源地址https://www.toymoban.com/news/detail-783697.html

…详情请参照古月居

到了这里,关于经典文献阅读之--Calib Anything(使用SAM的无训练标定雷达相机外参)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【论文阅读笔记】Sam3d: Segment anything model in volumetric medical images[

    Bui N T, Hoang D H, Tran M T, et al. Sam3d: Segment anything model in volumetric medical images[J]. arXiv preprint arXiv:2309.03493, 2023.【开源】 本文提出的SAM3D模型是针对三维体积医学图像分割的一种新方法。其核心在于将“分割任何事物”(SAM)模型的预训练编码器与一个轻量级的3D解码器相结合。与

    2024年01月20日
    浏览(36)
  • 经典文献阅读之--PCAccumulation(动态三维场景构建)

    多波束激光雷达传感器,常用于自动驾驶汽车和移动机器人,获取三维范围扫描序列(“帧”)。由于角度扫描分辨率有限和遮挡,每帧只稀疏地覆盖场景。稀疏性限制了下游过程的性能,如语义分割或表面重建。幸运的是,当传感器移动时,从不同的视点捕获帧。这提供了

    2024年02月03日
    浏览(30)
  • 经典文献阅读之--STD(激光SLAM回环检测算法)

    各位也知道,我们在之前的博客中,介绍了很多回环的方法,比如Scan Context,Lris, BoW3D等方法。之前作者也在《重定位解析与思考》一文中,给到了一些回环检测算法的介绍。最近林博新开源了一个回环检测算法《STD: A Stable Triangle Descriptor for 3D place recognition》。我们从小乌坞

    2024年02月03日
    浏览(28)
  • 经典文献阅读之--VoxelMap(体素激光里程计)

    作为激光里程计,常用的方法一般是特征点法或者体素法,最近Mars实验室发表了一篇文章《Efficient and Probabilistic Adaptive Voxel Mapping for Accurate Online LiDAR Odometry》,同时还开源了代码在Github上。文中为雷达里程计提出了一种高效的概率自适应体素建图方法。地图是体素的集合,

    2024年02月16日
    浏览(29)
  • 经典文献阅读之--PL-SLAM(点线SLAM)

    之前作者基本都在围绕着特征点提取的路径在学习,最近看到了最近点云PCL推送的《Structure PLP-SLAM: Efficient Sparse Mapping and Localization using Point, Line and Plane for Monocular, RGB-D and Stereo Cameras》。这个工作是基于OpenVSLAM架构的,但是由于OpenVSLAM被认为侵权,所以作者想从PL-SLAM开始,学

    2024年02月11日
    浏览(29)
  • 经典文献阅读之--VoxFormer(基于Transformer的3D语义场景补全)

    之前了解了很多BEV的相关操作,但是基本上要么是激光和视觉结合,要么是纯视觉完成的2D激光投影这两种,而那种3D Occupancy方法可以利用栅格的方法完成纯视觉占据栅格的生成。《VoxFormer: Sparse Voxel Transformer for Camera-based 3D Semantic Scene Completion》就是这种方法对于被遮挡的物

    2024年01月23日
    浏览(40)
  • 使用Segment Anything(SAM)模型进行自动标注

    1.下载项目 项目1:https://github.com/zhouayi/SAM-Tool 项目2:https://github.com/facebookresearch/segment-anything 下载 SAM 模型:https://dl.fbaipublicfiles.com/segment_anything/sam_vit_h_4b8939.pth 2.把数据放置在 dataset_path/images/* 这样的路径中,并创建空文件夹 dataset_path/embeddings 3.将项目1中的 helpers 文件夹复

    2024年02月04日
    浏览(38)
  • 经典文献阅读之--Dynamic-VINS(动态点滤除VINS)

    现在的SLAM算法在静态环境中表现良好,但在动态环境中很容易失败。最近的工作将基于深度学习的语义信息引入到SLAM系统以减轻动态对象的影响。然而,在资源受限的机器人的动态环境中应用鲁棒定位仍然具有挑战性。所以《RGB-D Inertial Odometry for a Resource-Restricted Robot in Dy

    2024年02月09日
    浏览(45)
  • Segment Anything(SAM)的demo的简单使用

    目录 SAM的demo源码使用 结合SAM,进行人机交互ui使用的案例介绍: 最近新发现的,可以利用这个模型,进行一个简单的UI使用,效果如下: labelimg结合SAM实现半自动标注软件 首先说明这个链接里面的代码是关于demo的,目前还不能训练。 原仓库 https://github.com/facebookresearch/seg

    2024年02月01日
    浏览(30)
  • 经典文献阅读之--Gaussian Splatting SLAM(单目3D高斯溅射重建)

    3D GS在NeRF领域已经掀起了一股浪潮,然后又很快席卷到了SLAM领域,最近已经看到很多3D GS和SLAM结合的开源工作了。将为大家分享帝国理工学院戴森机器人实验最新开源的方案《Gaussian Splatting SLAM》,这也是第一个将3D GS应用到增量3D重建的工作,速度为3 FPS。要想实时从摄像头

    2024年03月10日
    浏览(41)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包