← 返回论文列表

保持CALM:通过辅助视觉实现基于视觉几何基础模型的无标定千米级SLAM
Keep It CALM: Toward Calibration-Free Kilometer-Level SLAM with Visual Geometry Foundation Models via an Assistant Eye

作者: Tianjun Zhang, Fengyi Zhang, Tianchen Deng 等5人
arXiv: 2604.14795v1
分类: cs.RO
📝 论文摘要
视觉几何基础模型(VGFMs)在局部重建中展现出卓越的零样本能力,然而将其应用于千米级同步定位与建图(SLAM)仍面临挑战。现有方法在此类场景中主要依赖线性变换(如Sim3和SL4)进行子地图对齐,但我们认为单一线性变换本质上无法充分建模VGFM输出中固有的复杂非线性几何畸变。强行采用此类刚性对齐方式会导致未校正残差快速累积,最终引发显著的轨迹漂移与地图发散。为突破这些局限,我们提出了CAL2M(免标定辅助视角大规模定位与建图框架),这是一个兼容任意VGFM的即插即用框架。与传统系统不同,CAL2M引入“辅助视角”仅用于利用恒定物理间距的先验知识,无需任何时空预标定即可有效消除尺度模糊性。此外,基于特征匹配准确的假设,我们提出了一种极线引导的内参与位姿校正模型。该模型通过在线内参搜索模块的支持,能够基于基础矩阵分解有效校正由内参不准确引起的旋转和平移误差。最后,为确保建图精度,我们提出了基于锚点传播的全局一致性建图策略。通过在轨迹上构建并融合锚点,我们建立了从局部到全局的直接映射关系。这使得非线性变换得以应用于弹性对齐子地图,有效消除几何错位,确保重建结果的全局一致性。CAL2M的源代码将在https://github.com/IRMVLab/CALM公开。

📊 核心分析

🎯 研究动机
论文旨在解决视觉几何基础模型(VGFMs)在千米级同时定位与建图(SLAM)中部署的挑战。研究背景是:现有方法主要依赖线性变换(如Sim3、SL4)进行子地图对齐,但单一线性变换本质上无法建模VGFM输出中固有的复杂非线性几何畸变,导致未校正残差快速累积,最终引发显著的轨迹漂移和地图发散。
🔧 核心方法
论文提出了CAL2M(基于辅助眼的无标定大规模定位与建图)框架,具体包含: - 引入一个“辅助眼”,仅利用恒定物理间距先验,无需任何时空预标定即可消除尺度模糊性。 - 提出基于对极几何的相机内参和位姿校正模型,在在线内参搜索模块支持下,通过基础矩阵分解有效校正由不准确内参引起的旋转和平移误差。 - 提出基于锚点传播的全局一致建图策略,通过构建和融合轨迹上的锚点,建立局部到全局的直接映射关系,应用非线性变换弹性对齐子地图。
💡 核心创新
论文的核心创新点在于: - **首次系统性地解决了VGFMs在长距离SLAM中的非线性几何畸变累积问题**,突破了传统线性对齐方法的局限。 - **提出了“辅助眼”概念**,仅利用恒定物理间距这一弱先验实现无标定尺度恢复,方法新颖且实用。 - **将对极几何约束与在线内参搜索相结合**,构建了内参-位姿联合校正模型,有效提升了系统在未知或变化内参下的鲁棒性。 - **设计了基于锚点传播的非线性子地图对齐策略**,实现了弹性而非刚性的地图融合,从根本上消除了几何错位。
🏆 总体贡献
论文对该领域的整体贡献是: - 提出了一个与任意VGFMs兼容的即插即用框架CAL2M,首次实现了无需标定的千米级视觉SLAM。 - 从理论和方法上证明了单一线性变换对齐VGFM子地图的不足,并提供了系统性的非线性校正解决方案。 - 通过引入辅助眼、对极几何校正和锚点传播策略,显著提升了大规模场景下SLAM的轨迹精度和地图一致性,为视觉基础模型在机器人等领域的实际应用扫除了关键障碍。