- 仿人机器人需要**表达性全身运动(expressive whole-body motion)** 以在人类环境中稳定移动并呈现 readable 和可调的身体行为
- 现有表达性运动大多来自**固定演示(fixed demonstrations)** 或**手动脚本(manually designed scripts)**,难以在不同运动内容间重用展示的风格
- 受人类运动风格通过**步态节奏(gait rhythm)、姿势(posture)、手臂摆动(arm swing)和身体摇摆(body sway)** 传达情感和意图线索的启发
- 提出**仿生生成到控制框架(bionic generation-to-control framework)**,以人类风格样本和目标内容运动为输入,生成风格化全身参考
- 开发**物理感知多条件潜在扩散模型(physics-aware multi-condition latent diffusion model)** 融合风格、内容和轨迹条件,并使用**无分类器引导(classifier-free guidance)** 调整风格强度无需重训练
- 训练时施加**接触一致性(contact-consistency)** 和**时间平滑性(temporal-smoothness)** 正则化,提升硬件可执行性;生成的参考转换为G1兼容参考
- 采用**基于预览的全身跟踪策略(preview-based whole-body tracking policy)**,通过**集群与蒸馏策略(cluster-and-distill strategy)** 训练,将参考转化为实际控制
- **仿生风格迁移流程**:首次将短人类运动示范作为可重用仿生源,直接迁移风格到不同机器人运动内容,而非依赖固定演示或手动脚本
- **物理感知扩散模型**:多条件融合(风格、内容、轨迹)加上接触平滑正则化,生成可物理执行的参考,避免动画风格迁移常见的接触和抖动伪影
- **无分类器引导风格强度调节**:无需重新训练即可调整风格强度,提升灵活性
- **集群蒸馏策略**:将复杂参考蒸馏为基于预览的跟踪策略,实现实时且物理一致的全身控制
- 为仿人机器人表达性运动提供了一种**仿生生成到控制范式**,使短人类示范成为可重用的风格源
- 在仿真和Unitree G1真实机器人上验证,**125次真实实验成功率达96.0%**,显著优于动画风格迁移基线
- 通过**接触一致性和时间平滑性正则化** 有效减少伪影,提升运动物理可执行性,推动仿人机器人表达性行为的实际部署