论文旨在解决视觉几何基础模型(VGFMs)在千米级同时定位与建图(SLAM)中部署的挑战。研究背景是:现有方法主要依赖线性变换(如Sim3、SL4)进行子地图对齐,但单一线性变换本质上无法建模VGFM输出中固有的复杂非线性几何畸变,导致未校正残差快速累积,最终引发显著的轨迹漂移和地图发散。
论文提出了CAL2M(基于辅助眼的无标定大规模定位与建图)框架,具体包含:
- 引入一个“辅助眼”,仅利用恒定物理间距先验,无需任何时空预标定即可消除尺度模糊性。
- 提出基于对极几何的相机内参和位姿校正模型,在在线内参搜索模块支持下,通过基础矩阵分解有效校正由不准确内参引起的旋转和平移误差。
- 提出基于锚点传播的全局一致建图策略,通过构建和融合轨迹上的锚点,建立局部到全局的直接映射关系,应用非线性变换弹性对齐子地图。
论文的核心创新点在于:
- **首次系统性地解决了VGFMs在长距离SLAM中的非线性几何畸变累积问题**,突破了传统线性对齐方法的局限。
- **提出了“辅助眼”概念**,仅利用恒定物理间距这一弱先验实现无标定尺度恢复,方法新颖且实用。
- **将对极几何约束与在线内参搜索相结合**,构建了内参-位姿联合校正模型,有效提升了系统在未知或变化内参下的鲁棒性。
- **设计了基于锚点传播的非线性子地图对齐策略**,实现了弹性而非刚性的地图融合,从根本上消除了几何错位。
论文对该领域的整体贡献是:
- 提出了一个与任意VGFMs兼容的即插即用框架CAL2M,首次实现了无需标定的千米级视觉SLAM。
- 从理论和方法上证明了单一线性变换对齐VGFM子地图的不足,并提供了系统性的非线性校正解决方案。
- 通过引入辅助眼、对极几何校正和锚点传播策略,显著提升了大规模场景下SLAM的轨迹精度和地图一致性,为视觉基础模型在机器人等领域的实际应用扫除了关键障碍。