面向模糊用户查询的基于比较判断的主动实例导航

📝 论文摘要

当用户初始请求未唯一指定目标实例时，自然语言实例导航便面临挑战。一个实用的智能体应通过主动询问仅需区分目标与相似干扰物的信息来减少用户负担，而非要求用户预先提供详细描述。现有方法往往难以实现这一目标：它们可能在充分探索候选方案前就止步于第一个看似合理的候选项，或者即便收集了多个候选对象，也只是询问从单个候选对象中提取的目标属性，而非选择能够区分候选池中对象的问题。结果，尽管进行了对话，智能体仍可能无法将目标与干扰物区分开，导致过早决策和冗长的用户回应。我们提出基于比较判断的主动实例导航（ProCompNav），这是一个两阶段框架，首先构建候选池，然后通过比较判断识别目标。在每一轮中，ProCompNav提取一个能分割当前候选池的属性-值对，提出一个二元是/否问题，并立即剪除所有不一致的候选对象。这将以开放型目标描述进行消歧的方式转变为基于候选池的区分性提问，其中每个问题都旨在缩小候选集。在CoIN-Bench上，ProCompNav相较于使用相同最小输入的可交互基线和需要详细描述的不可交互基线，成功率有所提升，同时显著降低了响应长度。ProCompNav还在TextNav上取得了最先进的成功率，表明比较判断对于相似干扰物中的实例级导航具有广泛适用性。

🎯 研究动机

- 解决**自然语言实例导航(natural-language instance navigation)** 中初始用户查询模糊、无法唯一指定目标实例的问题 - 现有方法要么过早停于首个可行候选，未充分探索替代；要么在收集多个候选后，基于单个候选的属性提问，而非选择能区分候选池的问题，导致区分失败和冗长响应 - 研究背景：实际智能体应主动询问仅需的信息以区分目标与相似干扰物，减轻用户负担

🔧 核心方法

- 提出**ProCompNav(Proactive Instance Navigation with Comparative Judgment)** 两阶段框架：第一阶段构建候选池，第二阶段通过比较判断识别目标 - 每轮交互中，提取一个**属性-值对(attribute-value pair)** 来分割当前候选池，询问二元是/否问题，并立即剪枝所有不一致的候选 - 将消歧从开放的目标描述重构为**池级判别性提问(pool-level discriminative questioning)**，每个问题旨在缩小候选集

💡 核心创新

- **比较判断(comparative judgment)** 范式：用池级判别性提问替代传统的基于单个候选的属性询问，每个问题根据候选池的差异来选择，而非基于单个实例 - **主动剪枝(active pruning)**：通过二元问题一次性排除所有不一致候选，减少不必要的用户输入 - **端到端优化**：在CoIN-Bench上使用相同最小输入相比交互基线提升成功率，同时大幅缩短响应长度；在TextNav上达到SOTA

🏆 总体贡献

- 为模糊用户查询下的实例导航提供了一种**主动询问+比较判断(proactive questioning + comparative judgment)** 的新框架 - 在**CoIN-Bench** 和**TextNav** 基准上实现了**最先进(state-of-the-art)性能**，验证了比较判断在相似干扰物实例导航中的广泛适用性 - 通过减少用户响应长度，提升了人机交互效率

面向模糊用户查询的基于比较判断的主动实例导航
Proactive Instance Navigation with Comparative Judgment for Ambiguous User Queries

📊 核心分析

面向模糊用户查询的基于比较判断的主动实例导航 Proactive Instance Navigation with Comparative Judgment for Ambiguous User Queries

📊 核心分析

面向模糊用户查询的基于比较判断的主动实例导航
Proactive Instance Navigation with Comparative Judgment for Ambiguous User Queries