人形机器人在执行长时间、动态的类人搏斗任务时,对敏捷性和稳定性要求极高,现有方法(如切换多个单技能策略或使用通用策略模仿参考运动)在技能切换时因初始与终止状态不匹配或参考运动引入的域外扰动,导致行为不稳定或不平滑。
提出了一种混合专家策略框架RPG,通过运动过渡随机化(motion transition randomization)和时间随机化(temporal randomization)训练统一策略,并设计了一个将行走/奔跑运动与搏斗技能集成的控制管线,支持任意时长的类人连续战斗,可随时无缝中断或切换动作策略。
1. 提出运动过渡随机化和时间随机化技术,用于训练统一策略,确保技能切换时的平滑性和稳定性;2. 设计集成行走/奔跑与搏斗技能的控制管线,实现任意时长的类人连续战斗且支持随时中断或切换策略。
提出了一种鲁棒的策略门控框架RPG,解决了人形机器人多技能切换中的不稳定问题,在仿真和真实Unitree G1机器人上验证了其有效性、鲁棒性和实用性,推动了人形机器人动态搏斗任务的实际应用。