学习失重：在仿人机器人上模仿非自稳定运动

Learn Weightlessness: Imitate Non-Self-Stabilizing Motions on Humanoid Robot

作者: Yucheng Xin, Jiacheng Bao, Haoran Yang 等9人

arXiv: 2604.21351v1

分类: cs.RO

📝 论文摘要

模仿学习与强化学习的融合推动了人形机器人全身控制的显著进展，使其能够实现多样化的类人行为。然而，针对环境依赖型运动的研究仍然有限。现有方法通常强制要求刚性轨迹跟踪，而忽略了与环境的物理交互。我们观察到，人类在非自稳定（NSS）运动中会自然利用一种"失重"状态——选择性放松特定关节，使身体被动与环境接触，从而稳定身体并完成动作。受这一生物机制的启发，我们设计了一种用于数据集标注的失重状态自动标注策略，并提出失重机制（WM）方法，该方法能够动态决定哪些关节需要放松以及放松的程度，从而在执行目标动作的同时实现有效的环境交互。我们在三个具有代表性的NSS任务上评估了该方法：在不同高度的椅子上坐下、在不同倾斜度的床上躺下、以及通过肩部或肘部倚靠墙壁。在仿真环境和Unitree G1机器人上的大量实验表明，我们的WM方法仅基于单动作演示进行训练，无需任何任务特定调参，即可在多种环境配置下实现强泛化能力，同时保持运动稳定性。本研究弥合了精确轨迹跟踪与自适应环境交互之间的鸿沟，为接触丰富的人形机器人控制提供了一种生物启发的解决方案。

📊 核心分析

🎯 研究动机

现有的人形机器人全身控制方法主要依赖强化学习(Reinforcement Learning)和模仿学习(Imitation Learning)，但研究多集中于环境无关的运动，对环境依赖型运动（如坐、躺、靠墙）的研究有限。现有方法通常强制进行刚性轨迹跟踪，忽略了与环境的物理交互，导致在接触丰富的任务中适应性差。

🔧 核心方法

提出了一种基于生物机制的“失重机制”(Weightlessness Mechanism, WM)，包括：1) 一种失重状态自动标注策略(weightlessness-state auto-labeling strategy)，用于数据集标注；2) 动态决定哪些关节应放松以及放松程度的机制，使机器人能在执行目标运动的同时有效与环境交互。

💡 核心创新

核心创新在于模仿人类在非自稳定(Non-Self-Stabilizing, NSS)运动中利用“失重”状态——选择性放松特定关节以允许身体被动接触环境——从而在无需任务特定调参的情况下，实现从单一动作演示到多种环境配置的强泛化能力，弥合了精确轨迹跟踪与自适应环境交互之间的鸿沟。

🏆 总体贡献

该论文为人形机器人的接触丰富控制提供了一种生物启发的解决方案，通过引入失重机制，使机器人能够在坐、躺、靠墙等环境依赖型任务中稳定完成动作，并在仿真和Unitree G1机器人上验证了其跨环境泛化能力，推动了模仿学习与强化学习在复杂物理交互场景中的应用。