← 返回论文列表

具备失败归因的“先抓取后规划”:一种用于精确且可泛化机器人操作的闭环两阶段框架
具备失败归因的“先抓取后规划”:一种用于精确且可泛化机器人操作的闭环两阶段框架

作者: Jiahao Xu, Peiyuan Wang, Hanzhuo Zhang 等10人
arXiv: 2606.03385v1
分类: cs.RO, cs.AI
📝 论文摘要
在机器人操作中,抓取与运动规划之间的紧密耦合常常掩盖了真正的失败原因,导致低效的试错过程。为实现高效的长时域操作,我们提出了GTP-FA(先抓取后规划与失败归因),一种面向任务的两阶段“先抓取后规划”框架:首先生成抓取候选,再基于所选抓取执行下游运动规划。针对失败的操作轨迹,我们学习了一个失败归因模型,该模型可泛化至未见抓取,并生成关于失败模式的稳定分布以用于诊断导向的优化。基于归因结果,我们以诊断驱动的方式优化两个模块:在抓取侧,我们将任务级先验和风险惩罚引入抓取候选评分与优化中,以抑制不稳定或与任务不兼容的抓取;在规划侧,我们通过数据收集和微调针对高风险初始状态,以解决真正的规划瓶颈。我们在仿真和真实机器人实验中评估了所提框架,结果表明GTP-FA在基于强化学习、模仿学习、扩散策略和视觉-语言-动作模型的设置下改进了相应的基础学习器,显著提升了整体任务成功率。

📊 核心分析

🎯 研究动机
- 现有**机器人操作(robotic manipulation)** 中,抓取与运动规划紧密耦合,导致失败原因难以归因,试错效率低下 - 缺乏能够自动诊断失败模式并指导系统改进的闭环框架,特别是在**长程操作(long-horizon manipulation)** 场景下泛化能力不足
🔧 核心方法
- 提出**GTP-FA(Grasp-Then-Plan with Failure Attribution)** 框架,采用任务导向的两阶段策略:先生成**抓取候选(grasp candidates)**,再基于选定抓取执行下游**运动规划(motion planning)** - 学习一个**失败归因模型(failure attribution model)**,对失败轨迹生成稳定分布以指导诊断,并泛化到未见抓取 - 在抓取侧注入**任务级先验(task-level priors)** 和**风险惩罚(risk penalties)**,抑制不稳定或不兼容抓取;在规划侧通过**数据收集(data collection)** 和**微调(fine-tuning)** 针对高风险初始状态优化
💡 核心创新
- **诊断驱动的闭环优化**:首次将失败归因作为桥梁,使抓取与规划两个模块能基于失败根源进行协同调整,而非独立优化 - **泛化性**:失败归因模型可泛化到从未见过的抓取候选,避免对每个抓取单独建模 - **即插即用(plug-and-play)**:框架兼容多种基础方法(**强化学习(RL)**、**模仿学习(IL)**、**扩散策略(diffusion policy)**、**视觉-语言-动作(VLA)** 模型),无需修改原算法核心
🏆 总体贡献
- 提出一种可诊断、可泛化的两阶段操作框架,显著提升**整体任务成功率(overall task success rate)** - 在仿真和真实机器人实验中验证有效性,覆盖多个主流基线的统一提升 - 为机器人操作中失败分析与系统自改进提供了通用范式,有助于减少试错成本