← 返回论文列表

TARIC:中断语义线索下基于记忆增强的可通行性感知的户外视觉语言导航
TARIC: Memory-Augmented Traversability-Aware Outdoor VLN under Interrupted Semantic Cues

作者: Tianle Zeng, Hanjing Ye, Jianwei Peng 等6人
arXiv: 2605.31121v1
分类: cs.RO, cs.AI
📝 论文摘要
远程、开放世界环境中的室外视觉-语言导航常因语义线索中断而受到干扰,即信息性目标线索变得稀疏、被遮挡或离开视野。一旦此类线索消失,智能体便进入无线索阶段,往往退化为回溯、振荡航向或无目的探索。尽管基于记忆的方法试图弥合这些间隙,但在可通行性驱动的绕行场景中常失效:记忆中的线索方向可能不可行,迫使其绕行延长无线索阶段,逐渐使机器人中心的线索变得陈旧,隐式历史变得模糊。这使得可通行性成为维持目标导向导航的稳定条件,而不仅是局部安全问题。 我们提出一个统一的室外视觉-语言导航框架,通过在长时间无线索阶段维持可通行性一致的可执行引导,以抵御语义线索中断。具体而言,我们的方法从可见性门控的目标或探索线索中提取语义方位角,并利用实时近场可通行性剖面将其映射为可执行航向,提供超越仅拒绝式安全过滤器的目标一致可行引导。为防止绕行期间引导退化,我们将间歇性二维证据提升为世界对齐的三维线索记忆,并辅以不确定性感知读出机制,确保随着机器人移动,引导持续可达且稳定。 我们在四足和轮式平台上对长达600–1000米路径进行了评估。相较于最强基线,我们的方法在仿真中成功率提升超过10个百分点,并在真实世界中取得40%的成功率(最强基线为17.5%),在长时间无线索间隔中表现出显著更高的鲁棒性。

📊 核心分析

🎯 研究动机
- 解决室外**视觉-语言导航(VLN)** 在长距离开放世界中因语义线索中断而导致导航退化的问题(如回溯、振荡、盲目探索) - 现有基于记忆的方法在可通行性驱动的绕路情况下失效:记忆的线索方向不可行,导致绕路延长线索中断期,使得机器人中心线索过时、隐式历史模糊 - 指出**可通行性(traversability)** 不仅是局部安全因素,更是维持目标引导稳定性的条件
🔧 核心方法
- 提出统一框架**TARIC**,在长时间线索中断阶段维持可通行性一致的可行引导 - 从可见性门控的目标或探索线索中提取**语义方位(semantic bearings)**,利用实时**近场可通行性剖面(near-field traversability profile)** 将其映射为可执行的航向,提供超越单纯拒绝式安全过滤的目标一致可行引导 - 引入**世界对齐的3D线索记忆(world-aligned 3D cue memory)**,配合**不确定性感知读出机制(uncertainty-aware readout)**,将间歇的2D证据提升为连续可达的稳定引导
💡 核心创新
- **将可通行性视为稳定性条件**:不同于仅将可通行性用于局部安全过滤,本文将其作为维持目标引导长期一致的核心约束 - **不确定性感知的3D记忆**:构建世界坐标系下的3D线索记忆,并通过不确定性感知读出确保绕路过程中引导的连续可达性和稳定性,避免线索陈旧和记忆模糊 - **端到端统一框架**:结合语义方位提取、可通行性映射和记忆增强,在无线索阶段仍能提供可行、稳定的导航信号
🏆 总体贡献
- 在四足和轮式平台上进行600–1000米长距离户外评估,模拟**成功率(success rate)** 比最强基线提升超过10个百分点 - 真实世界成功率40%(最强基线仅17.5%),在长时间线索中断期间鲁棒性显著提高 - 为户外VLN领域提供了一种可通行性感知与记忆增强相结合的新范式,有效应对现实环境中的语义线索中断挑战