FAST-LIO论文阅读

这篇具有很好参考价值的文章主要介绍了FAST-LIO论文阅读。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

论文:FAST-LIO: A Fast, Robust LiDAR-inertial Odometry Package by Tightly-Coupled Iterated Kalman Filter

源码链接

各位大佬对论文的解析:
FAST-LIO论文解读与详细公式推导

FAST-LIO是港大MaRS实验室在2021年提出的一个紧耦合迭代扩展卡尔曼滤波高计算效率、高鲁棒性的雷达里程计。影响深远,后续又陆续提出了FAST-LIO2以及Faster-LIO等框架。
FAST-LIO论文阅读
下面,我们简单了解一些论文中的各个模块及其处理流程。

符号说明

FAST-LIO论文阅读
t k t_{k} tk第K帧激光扫描的结束时间
τ i \tau_{i} τiLiDAR扫描帧中的第i个IMU数据
ρ j \rho_{j} ρjLiDAR扫描帧中的第j个激光点时间
I i , I j , I k I_{i},I_{j},I_{k} Ii,Ij,Ik IMU在 τ i \tau_{i} τi ρ j \rho_{j} ρj,以及 t k t_{k} tk三个时刻的载体坐标系
L j , L k L_{j},L_{k} Lj,Lk LiDAR在 ρ j \rho_{j} ρj t k t_{k} tk时刻的激光坐标系。
X , X ^ , X ˉ X,\hat{X}, \bar{X} XX^Xˉ:状态X的真值,预测值,更新值(后验,估计值)
X ~ \tilde{X} X~:状态X的真值 X X X与估计值 X ˉ \bar{X} Xˉ之间的误差(即: X ~ = X ⊟ X ˉ \tilde{X}=X\boxminus\bar{X} X~=XXˉ X = X ~ ⊞ X ˉ X=\tilde{X}\boxplus\bar{X} X=X~Xˉ )
X ^ κ \hat{X}^\kappa X^κ:迭代扩展卡尔曼滤波(IEKF)中的第 κ \kappa κ次迭代的状态量
X i , X j , X k X_{i},X_{j},X_{k} Xi,Xj,Xk:在 τ i \tau_{i} τi ρ j \rho_{j} ρj,以及 t k t_{k} tk三个时刻的状态量
X ˇ j \check{X}_{j} Xˇj:在后向传播中,相对于 t k t_{k} tk时刻状态 X k X_{k} Xk的估计值 X j X_{j} Xj

基础概念(运算符)

作者在文中定义了两个基础的运算符, ⊞ \boxplus ⊟ \boxminus
FAST-LIO论文阅读
这里的 M M M表示一种 n n n维的流形。
⊞ \boxplus 操作对应于在流形 M M M上增加一个小的扰动。
⊟ \boxminus 操作对应于两个流形 M 1 M_1 M1 M 2 M_2 M2之间的微小差值。
分别对应于指数映射与对数映射。
FAST-LIO论文阅读
同时,我们可以推导出下述结论
FAST-LIO论文阅读

文中以IMU坐标系作为载体系,推出来的位姿也在载体系中。假设激光雷达与IMU刚性链接,使用一个外参转换关系 I T L = ( I R L , I p L ) {^I}T{_L}=({^I}R{_L}, {^I}p{_L}) ITL=(IRL,IpL)进行转换。

IMU连续模型

IMU的动力学模型如下:
FAST-LIO论文阅读

这是易于理解的,位置的导数是速度,速度的导数为加速度(增加的坐标转换与重力影响),重力为一个常数,导数为0,旋转的导数为角速度(推导可以参考高翔博士的SLAM十四讲),陀螺仪与加速计零偏的导数为高斯白噪声。

IMU离散模型

假设,IMU的采样频率为 Δ t \Delta t Δt,则离散模型可以写成如下形式:

FAST-LIO论文阅读
其中:
FAST-LIO论文阅读

LiDAR帧的概念

实际工作过程中 LiDAR是在不断的连续扫描的(这个频率非常高,数十万Hz),但是我们为了能够处理点云数据,人为的划分成了不同的扫描帧,如文中把累积20ms的点云作为一帧数据,扫描频率为50Hz。
FAST-LIO论文阅读
即把上图中 t k − 1 t_{k-1} tk1 t k t_{k} tk的时间段(20ms)划分为一帧点云。

但是,这样引起一个问题是,带来了运动畸变。对于这一问题,在后续的章节中通过后向传播来进行纠正。

状态估计

FAST-LIO论文阅读

作者使用误差作为要估计的状态,这样做有一系列好处:参考高翔博士-简明ESKF推导

  1. 在旋转的处理上,ESKF的状态变量可以采用最小化的参数表达,也就是使用三维变量来表达旋转的增量。而传统KF需要用到四元数(4维)或者更高维的表达(旋转矩阵,9维),要不就得采用带有奇异性的表达方式(欧拉角)。
  2. ESKF总是在原点附近,离奇异点较远,并且也不会由于离工作点太远而导致线性化近似不够的问题。
  3. ESKF的状态量为小量,其二阶变量相对来说可以忽略。同时大多数雅可比矩阵在小量情况下变得非常简单,甚至可以用单位阵代替。
  4. 误差状态的运动学也相比原状态变量要来得更小,因为我们可以把大量更新部分放到原状态变量中。

前向传播(运动方程)

前向传播的执行过程如下,每次接收到一次数据我们就会执行一次。
FAST-LIO论文阅读

此外,由于不知道噪声的值,所以设置噪声 w w w为0,不断进行前向传播。当然,这样很快就会“飘”。但是,我们还有观测方程(LiDAR)进行修正。

对公式(4)转换为误差的形式,并进行线性化:
FAST-LIO论文阅读
F X ~ F_{\tilde{X}} FX~ F W F_{W} FW分别为 X ~ i + 1 \tilde{X}_{i+1} X~i+1 w i {w}_{i} wi变量的雅克比矩阵。形式如下:
FAST-LIO论文阅读
其中A(.)的表示方式为:
FAST-LIO论文阅读

推导方式见论文中的附录,这里就不详细说了,很烦人。

有了运动方程的线性化表达式,我们还需要对应的协方差更新方式,假设噪声 w w w的协方差为 Q Q Q,则更新方式为:
FAST-LIO论文阅读
直到一帧的扫描终点时刻 t k t_k tk,一个前向传播过程才结束。终点时刻 t k t_k tk的预测状态表示为 X ^ k \hat{X}_k X^k,对应的协方差表示为 P ^ k \hat{P}_k P^k(状态预测值 X ^ k \hat{X}_k X^k与状态真值 X k {X}_k Xk之间的误差的协方差 X ^ k ⊟ X k \hat{X}_k\boxminus{X}_k X^kXk)。

后向传播(运动畸变校正)

我们在处理过程中会融合在 t k t_k tk时刻的状态 X ^ k \hat{X}_k X^k与协方差 P ^ k \hat{P}_k P^k。但是,正如我们之前所提到的,每个点都有属于他们自己的时间戳,其测量时间并不是我们所规定的 t k t_k tk时刻,即LiDAR点采样(测量)时间 ρ j < t k \rho_j<t_k ρj<tk,这会引起参考坐标系的不一致。

FAST-LIO论文阅读

如图中的下半部分,为了消除这种影响,作者使用下述公式,反向(后向)从 t k t_k tk时刻的位姿,推算出 ρ j \rho_j ρj时刻的位姿,并把 ρ j \rho_j ρj时刻的特征点转换到 t k t_k tk时刻。
FAST-LIO论文阅读
FAST-LIO论文阅读
注意,因为特征点的频率高于IMU频率,所以并不是每个特征点时刻对应一个位姿。每个特征点的转换位姿都由其左侧的IMU时刻确定。

通过上述计算,得到 ρ j \rho_j ρj时刻到 t k t_k tk时刻的相对位姿为: I k T ˇ I j = ( I k R ˇ I j , I k p ˇ I j ) ^{I_k}{\check T}_{I_j}=(^{I_k}{\check R}_{I_j}, ^{I_k}{\check p}_{I_j}) IkTˇIj=(IkRˇIj,IkpˇIj)

基于此,我们可以通过下式,把局部坐标系的点测量值 L j p f j ^{L_j}{p}_{f_j} Ljpfj,投影的扫描终点时刻 t k t_k tk,即 L k p f j ^{L_k}{p}_{f_j} Lkpfj
L k p f j = I T L − 1 I k T ˇ I j I T L L j p f j ^{L_k}{p}_{f_j}={^{I}{T}^{-1}_{L}} {^{I_k}{\check T}_{I_j}} {^{I}{T}_{L}} {^{L_j}{p}_{f_j}} Lkpfj=ITL1IkTˇIjITLLjpfj
FAST-LIO论文阅读
式中, I T L ^{I}{T}_{L} ITL为LiDAR与IMU之间的外参, L k p f j ^{L_k}{p}_{f_j} Lkpfj为投影到扫描终点时刻 t k t_k tk的坐标,用于下面的残差计算。

残差计算

经过上节中的运动畸变校正,我们可以把一个扫描帧中的所有特征点视为在同一时刻 t k t_k tk处进行采样,接着,投影到全局坐标系中:
FAST-LIO论文阅读
式中, G T ^ I k κ {^{G}{\hat T}^{\kappa}_{I_k}} GT^Ikκ为我们想要求的 t k t_k tk时刻到全局坐标系下的位姿变换。

类似于LOAM的思想,转换后的特征点应该落在其对应的特征“线”“面”上,但是由于存在LiDAR测量误差与前向传播的状态推算误差,导致转换后的特征点并不能完全落在特征线/面上。
FAST-LIO论文阅读
式中, G j G_j Gj为法向量 u j T u^T_j ujT(平面特征)或为边缘线特征朝向的反对称阵 ⌊ u j ⌋ ∧ \left \lfloor u_j \right \rfloor_{\wedge } uj(边缘特征)。即计算点到面或者点到线之间的距离。

作者只考虑模长小于0.5m的残差值。残差值高于阈值的被认为是噪声点或者是新观测的点。

迭代状态更新

如果我们把激光雷达的测量噪声去除,假设测量的点都是真实的坐标。
FAST-LIO论文阅读
那么我们使用这个真值代入上述公式中转换的全局坐标系 G G G,再使用状态的真值 X k X_k Xk(有变换的真值 G T I k {^{G}{T}_{I_k}} GTIk),那么残差 z j κ z^{\kappa}_j zjκ的值应该为0;
FAST-LIO论文阅读
对上式 h j h_j hj进行一阶近似:
FAST-LIO论文阅读

式中, X ~ k κ = X k ⊟ X ^ k κ \tilde{X}^{\kappa}_k=X_k\boxminus\hat{X}^{\kappa}_k X~kκ=XkX^kκ X k = X ^ k κ ⊞ X ~ k κ X_k=\hat{X}^{\kappa}_k\boxplus\tilde{X}^{\kappa}_k Xk=X^kκX~kκ

存在:
FAST-LIO论文阅读
FAST-LIO论文阅读

结合(15)(运动方程)及残差(14)(观测方程),我们得到下述形式的目标函数:
FAST-LIO论文阅读
式中: ∥ x ∥ M 2 = X T M X \left \| x \right \|^2_M=X^TMX xM2=XTMX

利用迭代卡尔曼滤波,我们对(17)进行求解
FAST-LIO论文阅读

得到 X ˉ k \bar{X}_k Xˉk P ˉ k \bar{P}_k Pˉk

上述求解过程中还存在一个问题是求解卡尔曼增益K需要对 H P H T + R HPH^T+R HPHT+R进行求逆。这个维度为 m ∗ m m*m mm即特征点的数量(观测的数量)。这个维度是很大的,所以求解比较困难。

作者把卡尔曼增益的公式等价转换为下述形式,求逆的维度为状态量的维度 18 ∗ 18 18*18 1818,大大降低了计算的维度。
FAST-LIO论文阅读
等价转换过程的推导也是比较简单的,利用了矩阵的求逆定理。
FAST-LIO论文阅读文章来源地址https://www.toymoban.com/news/detail-488874.html

到了这里,关于FAST-LIO论文阅读的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • LIO-SAM 论文阅读

    论文链接 LIO-SAM 0. Abstract 提出了一种通过平滑和映射进行紧耦合激光雷达惯性里程计的框架 LIO-SAM,它实现了高精度、实时的移动机器人轨迹估计和地图构建 LIO-SAM 在因子图上制定激光雷达惯性里程计,允许将多种相对和绝对测量(包括闭环)从不同来源作为因子合并到系统

    2024年01月25日
    浏览(43)
  • 论文阅读《Robust Monocular Depth Estimation under Challenging Conditions》

    论文地址:https://arxiv.org/pdf/2308.09711.pdf 源码地址:https://github.com/md4all/md4all   现有SOTA的单目估计方法在理想的环境下能得到满意的结果,而在一些极端光照与天气的情况下往往会失效。针对模型在极端条件下的表现不佳问题,文章提出一种用于解决这种安全问题的模型:

    2024年02月09日
    浏览(43)
  • Benchmarking Augmentation Methods for Learning Robust Navigation Agents 论文阅读

    题目 :Benchmarking Augmentation Methods for Learning Robust Navigation Agents: the Winning Entry of the 2021 iGibson Challenge 作者 :Naoki Yokoyama, Qian Luo 来源 :arXiv 时间 :2022 深度强化学习和可扩展的真实感模拟的最新进展使得用于各种视觉任务(包括导航)的具体人工智能日益成熟。然而,虽然在

    2024年02月14日
    浏览(40)
  • [论文阅读] BoT-SORT: Robust Associations Multi-Pedestrian Tracking

    这篇文章是今年6月底发布的一篇多目标跟踪(MOT)的 屠榜 方法,命名为BoT-SORT。作者来自以色列的特拉维夫大学(Tel-Aviv University)。本文简单谈谈我对这个算法的理解,因为也是MOT领域的初学者,如有错误希望各位读者修正,也欢迎大家一起探讨。 PS:文章内部分图片是原创

    2024年02月02日
    浏览(44)
  • 论文阅读<Contrastive Learning-based Robust Object Detection under Smoky Conditions>

    论文链接:https://openaccess.thecvf.com/content/CVPR2022W/UG2/papers/Wu_Contrastive_Learning-Based_Robust_Object_Detection_Under_Smoky_Conditions_CVPRW_2022_paper.pdf         目标检测是指有效地找出图像中感兴趣的目标,然后准确地确定它们的类别和位置。近年来,许多优秀的方法被开发出来,以提供强

    2024年02月04日
    浏览(48)
  • 论文阅读《GlueStick: Robust Image Matching by Sticking Points and Lines Together》

    论文地址:https://arxiv.org/abs/2304.02008 源码地址:https://github.com/cvg/GlueStick   针对视角变化时在闭塞、无纹理、重复纹理区域的线段匹配难的问题,本文提出一种新的匹配范式(GlueStick),该方法基于深度图神经网络将点、线的描述符统一到一个框架中,利用点之间的信息将

    2024年02月08日
    浏览(43)
  • 【论文阅读笔记】Local Model Poisoning Attacks to Byzantine-Robust Federated Learning

    个人阅读笔记,如有错误欢迎指出! 会议: Usenix 2020 [1911.11815] Local Model Poisoning Attacks to Byzantine-Robust Federated Learning (arxiv.org) 问题:         模型攻击对拜占庭鲁棒性联邦学习的攻击效果尚未清楚 创新点:         1、基于不同防御方法,设计了具有针对性的模型攻击

    2024年02月10日
    浏览(63)
  • Cross-Drone Transformer Network for Robust Single Object Tracking论文阅读笔记

    无人机在各种应用中得到了广泛使用,例如航拍和军事安全,这得益于它们与固定摄像机相比的高机动性和广阔视野。多 无人机追踪系统可以通过从不同视角收集互补的视频片段 ,为目标提供丰富的信息,特别是当目标在某些视角中被遮挡或消失时。然而,在多无人机视觉

    2024年01月25日
    浏览(60)
  • 【论文阅读】以及部署BEVFusion: A Simple and Robust LiDAR-Camera Fusion Framework

    BEVFusion: A Simple and Robust LiDAR-Camera Fusion Framework BEVFusion:一个简单而强大的LiDAR-相机融合框架 NeurIPS 2022 多模态传感器融合意味着信息互补、稳定,是自动驾驶感知的重要一环,本文注重工业落地,实际应用 融合方案: 前融合(数据级融合)指通过空间对齐直接融合不同模态的

    2024年02月04日
    浏览(49)
  • SAFEFL: MPC-friendly Framework for Private and Robust Federated Learning论文阅读笔记

    SAFEFL,这是一个利用安全多方计算 (MPC) 来评估联邦学习 (FL) 技术在防止隐私推断和中毒攻击方面的有效性和性能的框架。 传统机器学习(ML):集中收集数据-隐私保护问题 privacy-preserving ML (PPML)采用的隐私保护技术:安全多方计算,同态加密(运算成本高) 联邦学习(FL):

    2024年04月22日
    浏览(53)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包