- 解决**人体运动重定向(human motion retargeting)** 到机器人形态时产生的**物理不一致** 问题,如**脚滑(foot sliding)**、**自碰撞(self-collisions)** 和**动态不可行(dynamically infeasible)** 运动。
- 现有方法生成的参考运动缺乏物理合理性,阻碍下游的**模仿学习(imitation learning)**。
- 研究背景:机器人与人体形态差异显著,手动调整运动参数费时且难以保证物理可行性。
- 提出**双层优化(bilevel optimization)框架**,上层优化调整参考运动以适应机器人形态,下层使用**强化学习(reinforcement learning)** 训练跟踪策略。
- 推导**上层损失的上层梯度近似(approximate gradient for the upper-level loss)**,使双层优化可求解。
- 仅需**稀疏语义刚体对应(sparse set of semantic rigid-body correspondences)**,无需手动调参,通过优化找到**参数化表达(parameterization)** 的最优值以保持特征运动。
- 将重定向过程直接集成到**物理仿真(physics simulation)** 中,生成物理合理的运动。
- **联合优化( joint optimization)**:首次在重定向与跟踪策略训练之间建立**端到端(end-to-end)** 的双层优化框架,而非独立处理。
- **梯度近似技术**:通过推导**近似梯度(approximate gradient)** 解决了双层优化中上层损失不可微的难题。
- **自动调参**:无需手动调整运动参数,算法自动找到最优参数化值,保留不同形态下的特征运动。
- **物理仿真集成**:重定向直接与物理仿真结合,确保输出运动的**物理合理性(physical plausibility)**,利于鲁棒的模仿学习。
- 为**物理感知运动重定向(physics-aware motion retargeting)** 提供了一种无需人工调整、自动生成物理合理运动的新范式。
- 在**形态差异显著** 的场景(如重定向到**四足机器人(quadruped)**)上验证了方法的有效性和泛化能力。
- 在仿真和硬件实验中展示了具有挑战性的运动,证明该方法能够促进**鲁棒的模仿学习(robust imitation learning)**。
- 仅需**稀疏语义对应**,降低了依赖密集标注或手工设计的门槛,易于推广到新机器人形态。