- 现有零样本目标导航(ZSON)方法局限于**平面表示(planar representations)** 和**单楼层假设(single-floor assumptions)**,无法应对真实建筑中的跨楼层场景
- 真实建筑包含楼层、楼梯、平台等**垂直空间(vertically overlapping spaces)**,现有方法在这些场景下表现不佳
- 研究背景:零样本目标导航在未见环境中具有潜力,但缺乏对三维结构和可遍历性的建模
- 维护一个**统一体积地图(unified volumetric map)**,区分占据结构与机器人可到达支撑面,并提取**可遍历前沿(traversable frontiers)**,包括地板、楼梯和平台
- 设计**FOV感知主动感知策略(FOV-aware active perception strategy)**,解决跨楼层遍历过程中的不完整观测问题
- 构建**轻量级引导模块(lightweight guidance module)**,在线开放词汇分割生成**概率实例地图(probabilistic instance map)**,结合快速图文匹配生成**空间价值地图(spatial value map)**,减少语义推理延迟
- 提出**分层规划器(hierarchical planner)**,对对象假设、可遍历前沿和楼梯地标进行**目标感知前沿巡游(target-aware frontier touring)**,并通过**立足点引导3D搜索(foothold-guided 3-D search)** 和**垂直约束局部轨迹优化(vertically constrained local trajectory optimization)** 生成可执行跨楼层运动
- **首创性**:首次将**可遍历性感知(traversability-aware)** 与**3D规划** 结合,实现**跨楼层(cross-floor)** 零样本目标导航
- **地图创新**:统一体积地图不仅区分占据与自由空间,还区分结构表面与可支撑面,支持跨楼层前沿提取
- **效率创新**:轻量级语义推理模块通过概率地图和图像-文本匹配对齐,显著降低开放词汇分割的推理延迟
- **规划创新**:分层规划器同时考虑对象假设、可遍历前沿和楼梯地标,并引入立足点和垂直约束优化,确保跨楼层运动可行性
- 提出**TravExplorer**,首个在真实建筑中实现**跨楼层零样本目标导航(cross-floor zero-shot object navigation)** 的端到端框架
- 在**HM3D** 和**MP3D** 模拟环境中的4,195个测试回合上,相较于代表性ObjectNav基线方法取得一致优势
- 在**Unitree Go2** 机器人上完成50次真实世界实验,验证了无需先验地图或人工干预的跨楼层开词汇目标搜索能力
- 开源代码(https://github.com/wuyi2121/TravExplorer),促进社区复现与后续研究