该论文旨在解决开放词汇(open-vocabulary)场景下的终身(lifelong)物体目标导航(Object Goal Navigation, ObjectNav)问题。研究背景是:现有方法在孤立、单一物体的导航任务中表现良好,但其终身记忆表示(lifelong memory representations)的适用性受限,这阻碍了智能体(agent)在长时间内持续、有效地导航到多个目标。
论文提出了一个名为OVAL的终身开放词汇记忆框架(lifelong open-vocabulary memory framework)。具体方法包括:
- 引入记忆描述符(memory descriptors),以促进记忆模型的结构化管理。
- 提出一种新颖的基于概率(probability-based)的探索策略(exploration strategy),利用多值边界评分(multi-value frontier scoring)来提升终身探索(lifelong exploration)的效率。
论文的核心创新点在于构建了一个统一的、支持开放词汇的终身记忆框架,以解决长期、多目标导航中的记忆表示和探索效率瓶颈。其独特之处在于:
- 将开放词汇(open-vocabulary)能力与终身记忆(lifelong memory)模型相结合,使智能体能够理解和导航到训练中未见过的语义类别目标。
- 设计了结构化的记忆描述符(memory descriptors),实现了对长期探索经验的更有效组织和管理。
- 提出了基于多值边界评分(multi-value frontier scoring)的概率探索策略,专门优化了终身(lifelong)场景下的探索效率,而不仅仅是单次任务。
论文对该领域的整体贡献是:
- 提出了OVAL框架,首次系统性地解决了开放词汇(open-vocabulary)设定下的终身物体目标导航(lifelong ObjectNav)问题。
- 通过引入结构化的记忆管理和高效的探索策略,显著提升了智能体在长期、语义开放任务中的导航效率和鲁棒性(robustness)。
- 广泛的实验验证了所提系统的有效性和优越性,为后续终身导航(lifelong navigation)研究提供了新的思路和基准。