- 解决**自然语言实例导航(natural-language instance navigation)** 中初始用户查询模糊、无法唯一指定目标实例的问题
- 现有方法要么过早停于首个可行候选,未充分探索替代;要么在收集多个候选后,基于单个候选的属性提问,而非选择能区分候选池的问题,导致区分失败和冗长响应
- 研究背景:实际智能体应主动询问仅需的信息以区分目标与相似干扰物,减轻用户负担
- 提出**ProCompNav(Proactive Instance Navigation with Comparative Judgment)** 两阶段框架:第一阶段构建候选池,第二阶段通过比较判断识别目标
- 每轮交互中,提取一个**属性-值对(attribute-value pair)** 来分割当前候选池,询问二元是/否问题,并立即剪枝所有不一致的候选
- 将消歧从开放的目标描述重构为**池级判别性提问(pool-level discriminative questioning)**,每个问题旨在缩小候选集
- **比较判断(comparative judgment)** 范式:用池级判别性提问替代传统的基于单个候选的属性询问,每个问题根据候选池的差异来选择,而非基于单个实例
- **主动剪枝(active pruning)**:通过二元问题一次性排除所有不一致候选,减少不必要的用户输入
- **端到端优化**:在CoIN-Bench上使用相同最小输入相比交互基线提升成功率,同时大幅缩短响应长度;在TextNav上达到SOTA
- 为模糊用户查询下的实例导航提供了一种**主动询问+比较判断(proactive questioning + comparative judgment)** 的新框架
- 在**CoIN-Bench** 和**TextNav** 基准上实现了**最先进(state-of-the-art)性能**,验证了比较判断在相似干扰物实例导航中的广泛适用性
- 通过减少用户响应长度,提升了人机交互效率