← 返回论文列表

TravExplorer:基于可通行性感知三维规划的跨楼层具身探索
TravExplorer: Cross-Floor Embodied Exploration via Traversability-Aware 3-D Planning

作者: Han Zheng, Zhe Chen, Yudong Huang 等7人
arXiv: 2605.19958v1
分类: cs.RO
📝 论文摘要
零样本物体导航(ZSON)在未知环境中进行开放词汇目标搜索方面展现出潜力,然而现有系统大多仍局限于平面表示和单楼层假设。这些假设在真实建筑中变得不充分——导航涉及楼层、楼梯、平台和垂直交叠空间。本文提出TravExplorer,一种跨楼层具身探索框架,它将零样本语义引导与可通行性感知的三维规划相结合。TravExplorer维护一个统一的体素地图,区分被占据结构与机器人可达的支持表面,并从相连的支持表面(包括楼层、楼梯和平台)中提取可通行的前沿。一种视场角(FOV)感知的主动感知策略进一步解决了跨楼层遍历过程中的不完整观测问题。为降低语义推理延迟,一个轻量级引导模块将来自在线开放词汇分割的概率实例图与来自快速图像-文本匹配的空间价值图对齐。基于这些几何与语义记忆,分层规划器在物体假设、可通行前沿和楼梯地标上执行目标感知的前沿遍历,并通过立足点引导的三维搜索和垂直约束的局部轨迹优化生成可执行的跨楼层运动。在HM3D和MP3D上的4,195个模拟场景实验表明,该方法相较于代表性物体导航基线具有持续优势。在宇树Go2机器人上进行的50次真实世界试验进一步验证了无需先验地图或人工干预,即可在单楼层和跨楼层室内环境中进行开放词汇目标搜索。代码将发布在https://github.com/wuyi2121/TravExplorer。

📊 核心分析

🎯 研究动机
- 现有零样本目标导航(ZSON)方法局限于**平面表示(planar representations)** 和**单楼层假设(single-floor assumptions)**,无法应对真实建筑中的跨楼层场景 - 真实建筑包含楼层、楼梯、平台等**垂直空间(vertically overlapping spaces)**,现有方法在这些场景下表现不佳 - 研究背景:零样本目标导航在未见环境中具有潜力,但缺乏对三维结构和可遍历性的建模
🔧 核心方法
- 维护一个**统一体积地图(unified volumetric map)**,区分占据结构与机器人可到达支撑面,并提取**可遍历前沿(traversable frontiers)**,包括地板、楼梯和平台 - 设计**FOV感知主动感知策略(FOV-aware active perception strategy)**,解决跨楼层遍历过程中的不完整观测问题 - 构建**轻量级引导模块(lightweight guidance module)**,在线开放词汇分割生成**概率实例地图(probabilistic instance map)**,结合快速图文匹配生成**空间价值地图(spatial value map)**,减少语义推理延迟 - 提出**分层规划器(hierarchical planner)**,对对象假设、可遍历前沿和楼梯地标进行**目标感知前沿巡游(target-aware frontier touring)**,并通过**立足点引导3D搜索(foothold-guided 3-D search)** 和**垂直约束局部轨迹优化(vertically constrained local trajectory optimization)** 生成可执行跨楼层运动
💡 核心创新
- **首创性**:首次将**可遍历性感知(traversability-aware)** 与**3D规划** 结合,实现**跨楼层(cross-floor)** 零样本目标导航 - **地图创新**:统一体积地图不仅区分占据与自由空间,还区分结构表面与可支撑面,支持跨楼层前沿提取 - **效率创新**:轻量级语义推理模块通过概率地图和图像-文本匹配对齐,显著降低开放词汇分割的推理延迟 - **规划创新**:分层规划器同时考虑对象假设、可遍历前沿和楼梯地标,并引入立足点和垂直约束优化,确保跨楼层运动可行性
🏆 总体贡献
- 提出**TravExplorer**,首个在真实建筑中实现**跨楼层零样本目标导航(cross-floor zero-shot object navigation)** 的端到端框架 - 在**HM3D** 和**MP3D** 模拟环境中的4,195个测试回合上,相较于代表性ObjectNav基线方法取得一致优势 - 在**Unitree Go2** 机器人上完成50次真实世界实验,验证了无需先验地图或人工干预的跨楼层开词汇目标搜索能力 - 开源代码(https://github.com/wuyi2121/TravExplorer),促进社区复现与后续研究