← 返回论文列表

面向人形机器人物理可执行全身控制的仿生人体运动风格迁移
面向人形机器人物理可执行全身控制的仿生人体运动风格迁移

作者: Tianchen Huang, Mingkuan Zhao, Yang Gao 等11人
arXiv: 2606.03536v1
分类: cs.RO
📝 论文摘要
富有表现力的全身运动对于在人类环境中运行的人形机器人至关重要,这类机器人需要在保持稳定运动的同时展现出可解读且可调节的身体行为。然而,大多数富有表现力的运动仍通过固定演示或手动设计的脚本获得,这使得在不同运动内容中复用演示风格变得困难。受人类运动风格通过步态节奏、姿态、手臂摆动和身体晃动传递情感与意图线索的启发,本文提出了一种基于示例驱动的人形机器人风格迁移仿生生成-控制框架。给定一段简短的人类风格示例及目标内容运动,该框架能够生成保留预期运动内容并迁移演示风格的风格化全身参考。我们开发了物理感知的多条件潜在扩散模型,用于融合风格、内容和轨迹条件,并采用无分类器引导在不重新训练的情况下调节风格强度。为提高硬件可执行性,在训练过程中对解码后的运动施加了接触一致性与时间平滑性正则化。生成的参考运动随后被转换为G1兼容的机器人参考,并由基于预览的全身跟踪策略(通过聚类-蒸馏策略训练)执行。仿真与Unitree G1实验表明,该方法能将简短的人类风格示例迁移至多种机器人运动内容,相比面向动画的风格迁移基线减少了接触与抖动伪影,并在125次真实机器人实验中实现了96.0%的成功率。结果证明了将简短人类运动示例作为可复用仿生源以实现物理可执行的富有表现力人形运动的可行性。

📊 核心分析

🎯 研究动机
- 仿人机器人需要**表达性全身运动(expressive whole-body motion)** 以在人类环境中稳定移动并呈现 readable 和可调的身体行为 - 现有表达性运动大多来自**固定演示(fixed demonstrations)** 或**手动脚本(manually designed scripts)**,难以在不同运动内容间重用展示的风格 - 受人类运动风格通过**步态节奏(gait rhythm)、姿势(posture)、手臂摆动(arm swing)和身体摇摆(body sway)** 传达情感和意图线索的启发
🔧 核心方法
- 提出**仿生生成到控制框架(bionic generation-to-control framework)**,以人类风格样本和目标内容运动为输入,生成风格化全身参考 - 开发**物理感知多条件潜在扩散模型(physics-aware multi-condition latent diffusion model)** 融合风格、内容和轨迹条件,并使用**无分类器引导(classifier-free guidance)** 调整风格强度无需重训练 - 训练时施加**接触一致性(contact-consistency)** 和**时间平滑性(temporal-smoothness)** 正则化,提升硬件可执行性;生成的参考转换为G1兼容参考 - 采用**基于预览的全身跟踪策略(preview-based whole-body tracking policy)**,通过**集群与蒸馏策略(cluster-and-distill strategy)** 训练,将参考转化为实际控制
💡 核心创新
- **仿生风格迁移流程**:首次将短人类运动示范作为可重用仿生源,直接迁移风格到不同机器人运动内容,而非依赖固定演示或手动脚本 - **物理感知扩散模型**:多条件融合(风格、内容、轨迹)加上接触平滑正则化,生成可物理执行的参考,避免动画风格迁移常见的接触和抖动伪影 - **无分类器引导风格强度调节**:无需重新训练即可调整风格强度,提升灵活性 - **集群蒸馏策略**:将复杂参考蒸馏为基于预览的跟踪策略,实现实时且物理一致的全身控制
🏆 总体贡献
- 为仿人机器人表达性运动提供了一种**仿生生成到控制范式**,使短人类示范成为可重用的风格源 - 在仿真和Unitree G1真实机器人上验证,**125次真实实验成功率达96.0%**,显著优于动画风格迁移基线 - 通过**接触一致性和时间平滑性正则化** 有效减少伪影,提升运动物理可执行性,推动仿人机器人表达性行为的实际部署