- 现有方法依赖遥操作(teleoperation)或人类演示的运动重定向(motion retargeting),无法自主发现接触丰富、长周期的人形机器人全身操控(loco-manipulation)运动。
- 任务中可能的接触交互空间随任务时长和场景物体数量呈组合爆炸增长,导致从头发现新运动极具挑战性。
- 当前缺少一种无需人类示范、完全自动化发现并部署长周期人形机器人操控技能的方法。
- 提出**MotionDisco** 框架,将大型语言模型(LLM)引导的进化搜索与顺序运动学动力学轨迹优化器(sequential kinodynamic trajectory optimizer)及剪枝策略(pruning strategy)相结合,快速发现新颖运动。
- 使用LLM引导进化搜索在交互序列空间中进行探索,通过高效轨迹优化和剪枝加速搜索过程。
- 在发现轨迹上训练强化学习(RL)跟踪策略,使运动迁移到真实人形机器人。
- **完全自主发现**:首次无需遥操作或人类示范,完全通过自动化进化搜索发现并部署长周期人形操控技能。
- **LLM引导进化搜索**:利用大型语言模型的先验知识指导交互序列探索,有效应对组合爆炸,提升搜索效率。
- **高效优化与剪枝**:结合顺序运动学动力学优化器和剪枝策略,加速收敛并减少无效轨迹。
- 为自主发现接触丰富、长周期人形机器人全身操控运动提供了一种全新范式。
- 在多个挑战性长周期任务上通过消融实验验证了LLM引导搜索的成功率。
- 首次在真实人形机器人上部署了完全自动化发现的长期操控技能,展示了方法的实用性和可迁移性。