现有的人形机器人全身控制方法主要依赖强化学习(Reinforcement Learning)和模仿学习(Imitation Learning),但研究多集中于环境无关的运动,对环境依赖型运动(如坐、躺、靠墙)的研究有限。现有方法通常强制进行刚性轨迹跟踪,忽略了与环境的物理交互,导致在接触丰富的任务中适应性差。
提出了一种基于生物机制的“失重机制”(Weightlessness Mechanism, WM),包括:1) 一种失重状态自动标注策略(weightlessness-state auto-labeling strategy),用于数据集标注;2) 动态决定哪些关节应放松以及放松程度的机制,使机器人能在执行目标运动的同时有效与环境交互。
核心创新在于模仿人类在非自稳定(Non-Self-Stabilizing, NSS)运动中利用“失重”状态——选择性放松特定关节以允许身体被动接触环境——从而在无需任务特定调参的情况下,实现从单一动作演示到多种环境配置的强泛化能力,弥合了精确轨迹跟踪与自适应环境交互之间的鸿沟。
该论文为人形机器人的接触丰富控制提供了一种生物启发的解决方案,通过引入失重机制,使机器人能够在坐、躺、靠墙等环境依赖型任务中稳定完成动作,并在仿真和Unitree G1机器人上验证了其跨环境泛化能力,推动了模仿学习与强化学习在复杂物理交互场景中的应用。