基于学习的分层场景图匹配用于利用先验地图的机器人定位

📝 论文摘要

精确的定位是室内环境自主机器人运行的基本要求。场景图将环境的空间结构编码为语义实体及其关系的层次结构，既可通过机器人传感器数据在线构建，也可从建筑信息模型等建筑先验知识离线生成。将这两种互补表示进行匹配，能够通过将机器人观测与已知结构先验进行对照，从而实现SLAM中的漂移校正。然而，在两者之间建立可靠的节点对应关系仍是一个开放挑战：现有的组合方法在大规模场景下成本过高，而先前的学习方法仅处理平面图匹配，忽略了两种表示中均存在的多层次语义结构。本文提出了一种可学习的端到端可微流水线，通过为两种图额外添加语义驱动的边类型以编码层级内与层级间关系，显式利用这种层次结构实现从高层房间概念到低层墙面的同步匹配。该方法仅基于平面图进行训练，在真实激光雷达环境中的F1指标上优于组合基线方法，同时运行速度快一个数量级，展示了在BIM辅助机器人定位中可行的零样本泛化能力。

🎯 研究动机

- 室内自主机器人需要精确的定位，现有**场景图(scene graph)** 可编码环境层次结构，但构建的在线图与离线先验图（如BIM）之间的匹配是开放挑战 - 现有组合式(combinatorial)匹配方法在大规模场景下计算代价过高，而先前学习方法仅处理**平面图匹配(flat graph matching)**，忽略了多级语义层次结构 - 研究背景：利用建筑信息模型(BIM)先验辅助机器人SLAM漂移修正，但缺乏高效可靠的节点对应建立方法

🔧 核心方法

- 提出一个**端到端可微(end-to-end differentiable)** 的管道，对两个图进行增强，添加语义驱动的边类型，编码**层内关系(intra-level relationships)** 和**层间关系(inter-level relationships)** - 显式利用层次结构，实现从高层房间概念到低层墙壁表面的**同步匹配(simultaneous matching)** - 模型仅使用楼层平面图训练，并在真实LiDAR环境中不进行微调直接测试（零样本）

💡 核心创新

- **层次结构利用**：首次在场景图匹配中显式利用多级语义层次（房间、墙面等），而非仅处理平面图 - **端到端可微**：整个管道可微分，避免了传统组合方法的离散搜索，实现高效优化 - **效率与泛化**：在真实LiDAR环境上运行速度比组合基线快**一个数量级(order of magnitude)**，并实现**零样本泛化(zero-shot generalization)** 至BIM辅助定位场景

🏆 总体贡献

- 为机器人定位领域提供了一种新颖的**层次场景图匹配(hierarchical scene graph matching)** 范式，有效连接在线传感器数据与离线先验地图 - 在真实LiDAR数据集上F1指标超越组合基线，同时大幅降低计算开销 - 展示了无需目标环境训练数据即可泛化的能力，促进了BIM辅助定位的实际部署

基于学习的分层场景图匹配用于利用先验地图的机器人定位
Learning-Based Hierarchical Scene Graph Matching for Robot Localization Leveraging Prior Maps

📊 核心分析

基于学习的分层场景图匹配用于利用先验地图的机器人定位 Learning-Based Hierarchical Scene Graph Matching for Robot Localization Leveraging Prior Maps

📊 核心分析

基于学习的分层场景图匹配用于利用先验地图的机器人定位
Learning-Based Hierarchical Scene Graph Matching for Robot Localization Leveraging Prior Maps