- 现有**机器人操作(robotic manipulation)** 中,抓取与运动规划紧密耦合,导致失败原因难以归因,试错效率低下
- 缺乏能够自动诊断失败模式并指导系统改进的闭环框架,特别是在**长程操作(long-horizon manipulation)** 场景下泛化能力不足
- 提出**GTP-FA(Grasp-Then-Plan with Failure Attribution)** 框架,采用任务导向的两阶段策略:先生成**抓取候选(grasp candidates)**,再基于选定抓取执行下游**运动规划(motion planning)**
- 学习一个**失败归因模型(failure attribution model)**,对失败轨迹生成稳定分布以指导诊断,并泛化到未见抓取
- 在抓取侧注入**任务级先验(task-level priors)** 和**风险惩罚(risk penalties)**,抑制不稳定或不兼容抓取;在规划侧通过**数据收集(data collection)** 和**微调(fine-tuning)** 针对高风险初始状态优化
- **诊断驱动的闭环优化**:首次将失败归因作为桥梁,使抓取与规划两个模块能基于失败根源进行协同调整,而非独立优化
- **泛化性**:失败归因模型可泛化到从未见过的抓取候选,避免对每个抓取单独建模
- **即插即用(plug-and-play)**:框架兼容多种基础方法(**强化学习(RL)**、**模仿学习(IL)**、**扩散策略(diffusion policy)**、**视觉-语言-动作(VLA)** 模型),无需修改原算法核心
- 提出一种可诊断、可泛化的两阶段操作框架,显著提升**整体任务成功率(overall task success rate)**
- 在仿真和真实机器人实验中验证有效性,覆盖多个主流基线的统一提升
- 为机器人操作中失败分析与系统自改进提供了通用范式,有助于减少试错成本