具备失败归因的“先抓取后规划”：一种用于精确且可泛化机器人操作的闭环两阶段框架

📝 论文摘要

在机器人操作中，抓取与运动规划之间的紧密耦合常常掩盖了真正的失败原因，导致低效的试错过程。为实现高效的长时域操作，我们提出了GTP-FA（先抓取后规划与失败归因），一种面向任务的两阶段“先抓取后规划”框架：首先生成抓取候选，再基于所选抓取执行下游运动规划。针对失败的操作轨迹，我们学习了一个失败归因模型，该模型可泛化至未见抓取，并生成关于失败模式的稳定分布以用于诊断导向的优化。基于归因结果，我们以诊断驱动的方式优化两个模块：在抓取侧，我们将任务级先验和风险惩罚引入抓取候选评分与优化中，以抑制不稳定或与任务不兼容的抓取；在规划侧，我们通过数据收集和微调针对高风险初始状态，以解决真正的规划瓶颈。我们在仿真和真实机器人实验中评估了所提框架，结果表明GTP-FA在基于强化学习、模仿学习、扩散策略和视觉-语言-动作模型的设置下改进了相应的基础学习器，显著提升了整体任务成功率。

🎯 研究动机

- 现有**机器人操作(robotic manipulation)** 中，抓取与运动规划紧密耦合，导致失败原因难以归因，试错效率低下 - 缺乏能够自动诊断失败模式并指导系统改进的闭环框架，特别是在**长程操作(long-horizon manipulation)** 场景下泛化能力不足

🔧 核心方法

- 提出**GTP-FA(Grasp-Then-Plan with Failure Attribution)** 框架，采用任务导向的两阶段策略：先生成**抓取候选(grasp candidates)**，再基于选定抓取执行下游**运动规划(motion planning)** - 学习一个**失败归因模型(failure attribution model)**，对失败轨迹生成稳定分布以指导诊断，并泛化到未见抓取 - 在抓取侧注入**任务级先验(task-level priors)** 和**风险惩罚(risk penalties)**，抑制不稳定或不兼容抓取；在规划侧通过**数据收集(data collection)** 和**微调(fine-tuning)** 针对高风险初始状态优化

💡 核心创新

- **诊断驱动的闭环优化**：首次将失败归因作为桥梁，使抓取与规划两个模块能基于失败根源进行协同调整，而非独立优化 - **泛化性**：失败归因模型可泛化到从未见过的抓取候选，避免对每个抓取单独建模 - **即插即用(plug-and-play)**：框架兼容多种基础方法（**强化学习(RL)**、**模仿学习(IL)**、**扩散策略(diffusion policy)**、**视觉-语言-动作(VLA)** 模型），无需修改原算法核心

🏆 总体贡献

- 提出一种可诊断、可泛化的两阶段操作框架，显著提升**整体任务成功率(overall task success rate)** - 在仿真和真实机器人实验中验证有效性，覆盖多个主流基线的统一提升 - 为机器人操作中失败分析与系统自改进提供了通用范式，有助于减少试错成本

具备失败归因的“先抓取后规划”：一种用于精确且可泛化机器人操作的闭环两阶段框架
具备失败归因的“先抓取后规划”：一种用于精确且可泛化机器人操作的闭环两阶段框架

📊 核心分析

具备失败归因的“先抓取后规划”：一种用于精确且可泛化机器人操作的闭环两阶段框架 具备失败归因的“先抓取后规划”：一种用于精确且可泛化机器人操作的闭环两阶段框架

📊 核心分析

具备失败归因的“先抓取后规划”：一种用于精确且可泛化机器人操作的闭环两阶段框架
具备失败归因的“先抓取后规划”：一种用于精确且可泛化机器人操作的闭环两阶段框架