MotionDisco: 面向极端人形运动操控的动作发现

📝 论文摘要

我们提出了MotionDisco，这是一个从零开始发现富含接触、长时域人形机器人移动操作运动的框架，无需依赖遥操作或从人类演示中进行运动重定向。这具有挑战性，因为可能的接触交互空间随任务时域和场景中物体数量呈组合增长。MotionDisco通过将大语言模型引导的交互序列进化搜索与高效的序贯运动动力学轨迹优化器和剪枝策略相结合，实现了新颖运动的快速发现。通过广泛的消融研究，我们展示了LLM引导的搜索在多个具有挑战性的长时域任务中成功发现了全身轨迹。最后，通过在发现的轨迹上训练强化学习跟踪策略，我们将运动迁移到真实人形机器人上。这是首个完全通过自动化进化搜索发现并部署长时域人形机器人移动操作技能的工作。实验补充视频见：https://youtu.be/DHiVz34QYlw。

🎯 研究动机

- 现有方法依赖遥操作(teleoperation)或人类演示的运动重定向(motion retargeting)，无法自主发现接触丰富、长周期的人形机器人全身操控(loco-manipulation)运动。 - 任务中可能的接触交互空间随任务时长和场景物体数量呈组合爆炸增长，导致从头发现新运动极具挑战性。 - 当前缺少一种无需人类示范、完全自动化发现并部署长周期人形机器人操控技能的方法。

🔧 核心方法

- 提出**MotionDisco** 框架，将大型语言模型(LLM)引导的进化搜索与顺序运动学动力学轨迹优化器(sequential kinodynamic trajectory optimizer)及剪枝策略(pruning strategy)相结合，快速发现新颖运动。 - 使用LLM引导进化搜索在交互序列空间中进行探索，通过高效轨迹优化和剪枝加速搜索过程。 - 在发现轨迹上训练强化学习(RL)跟踪策略，使运动迁移到真实人形机器人。

💡 核心创新

- **完全自主发现**：首次无需遥操作或人类示范，完全通过自动化进化搜索发现并部署长周期人形操控技能。 - **LLM引导进化搜索**：利用大型语言模型的先验知识指导交互序列探索，有效应对组合爆炸，提升搜索效率。 - **高效优化与剪枝**：结合顺序运动学动力学优化器和剪枝策略，加速收敛并减少无效轨迹。

🏆 总体贡献

- 为自主发现接触丰富、长周期人形机器人全身操控运动提供了一种全新范式。 - 在多个挑战性长周期任务上通过消融实验验证了LLM引导搜索的成功率。 - 首次在真实人形机器人上部署了完全自动化发现的长期操控技能，展示了方法的实用性和可迁移性。

MotionDisco: 面向极端人形运动操控的动作发现
MotionDisco: Motion Discovery for Extreme Humanoid Loco-Manipulation

📊 核心分析

MotionDisco: 面向极端人形运动操控的动作发现 MotionDisco: Motion Discovery for Extreme Humanoid Loco-Manipulation

📊 核心分析

MotionDisco: 面向极端人形运动操控的动作发现
MotionDisco: Motion Discovery for Extreme Humanoid Loco-Manipulation