- 现有**灵巧抓取(dexterous grasping)** 方法通常将物理稳定交互与语义任务引导作为分离目标,缺乏统一整合
- 研究背景:机器人操作要求同时实现可靠物理抓取和基于语义的意图理解,但现有技术难以兼顾
- 需要解决的核心问题:如何融合物理稳定性与语义推理,实现动态调整抓取策略的灵巧抓取框架
- 提出**语义接触引导灵巧抓取(SEmantic CONtact-guided Dexterous Grasping, SECOND-Grasp)** 统一框架
- 通过**视觉-语言推理(vision-language reasoning)** 获得粗略接触提案,再利用分割在多个视图中定位接触区域
- 引入**语义-几何一致性细化(Semantic-Geometric Consistency Refinement, SGCR)**,通过强制跨视图语义一致性并移除几何无效区域,生成可靠3D接触图
- 对每个接触图通过**逆运动学(inverse kinematics)** 推导可行手部姿态,产生监督信号用于策略学习
- **首次统一** 物理稳定性与语义理解:框架能够基于语义推理动态调整抓取策略,同时保证物理可行性
- **SGCR模块**:创新性地结合语义一致性与几何有效性,解决多视图接触预测的不一致问题,生成精确3D接触图
- **基于接触的监督信号生成**:通过逆运动学从接触图自动推导手部姿态,避免复杂的手部姿态标注,实现高效策略学习
- 提出**SECOND-Grasp** 新范式,为灵巧抓取在物理-语义协同方面提供了有效解决方案
- 在**DexGraspNet** 数据集上达到领先性能:已知类别抓取成功率98.2%,未见类别97.7%;意图感知抓取提升12.8%和26.2%
- 验证了方法的通用性,在**Shadow Hand** 和**Allegro Hand** 等多种机器人手上均表现良好