← 返回论文列表

点指与抓取:通过概率线索整合灵活选择够不到的物体
Point & Grasp: Flexible Selection of Out-of-Reach Objects Through Probabilistic Cue Integration

作者: Xuejing Luo, Hee-Seung Moon, Christian Holz 等4人
arXiv: 2604.22491v1
分类: cs.HC, cs.RO
📝 论文摘要
在混合现实(MR)中,选择不可及的物体是一项基本任务。现有方法依赖于单一线索或确定性融合多种线索,当主导线索变得不可靠时,会导致性能下降。本文提出了一种概率性线索整合框架,能够灵活组合多种用户生成的线索,用于意图推断。受自然抓取行为的启发,我们通过指向方向和抓取手势作为新型交互技术Point&Grasp实例化该框架。为此,我们收集了不可及抓取(ORG)数据集,以训练手势线索的鲁棒似然模型,该模型捕捉了现有可及数据集中不存在的抓取模式。用户研究表明,我们的线索整合选择方法不仅比单一线索基线方法在准确性和速度上有所提升,而且与最先进方法相比,在各种歧义来源下仍能保持实际有效性。数据集和代码可在https://github.com/drlxj/point-and-grasp获取。

📊 核心分析

🎯 研究动机
- 解决混合现实(Mixed Reality, MR)中**远距离物体选择**这一基本任务中的准确性问题 - 现有方法依赖单一线索(cue)或确定性地融合多个线索,当主导线索不可靠时性能下降 - 研究背景:用户生成的多模态线索(如指向、手势)在混合现实中存在歧义,需要灵活的概率融合机制
🔧 核心方法
- 提出**概率线索融合(probabilistic cue integration)框架**,通过贝叶斯推理融合多个用户生成的线索进行意图推断 - 实例化为**Point&Grasp**交互技术,融合指向方向(pointing direction)和抓取手势(grasp gestures)作为两个线索 - 采集**远距离抓取(Out-of-Reach Grasping, ORG)数据集**,训练手势线索的鲁棒似然模型,捕捉远距离抓取模式 - 通过用户研究评估,比较单一线索基线和最新方法在不同歧义场景下的表现
💡 核心创新
- **首创概率建模**:首次在混合现实远距离物体选择中引入概率线索融合框架,而非确定性融合 - **灵感来源于自然抓握行为**:将指向和抓取手势作为自然交互组合,模拟人类远距离选择行为 - **专用数据集**:构建ORG数据集填补现有近距抓取数据集的空白,涵盖远距离抓取模式 - **鲁棒性强**:通过概率融合在多种歧义场景(如指向模糊、手势变化)下保持有效性
🏆 总体贡献
- 为混合现实远距离交互提供了一种**灵活的概率线索融合范式**,提升了意图推断的准确性和速度 - 提出**Point&Grasp**新型交互技术,在用户研究中优于单一线索基线和最新方法 - 公开了ORG数据集和代码,促进社区复现并推动混合现实物体选择研究