该论文旨在解决足式机器人(legged robots)在真实环境中执行移动操作(loco-manipulation)任务(如推车)时面临的挑战。研究背景是:同时保持稳定的运动(locomotion)和执行精确的操作(manipulation)行为非常困难,导致学习鲁棒的移动操作技能具有挑战性。
论文提出了一种部分模仿学习(partial imitation learning)方法。具体步骤为:
- 首先,通过广泛的领域和地形随机化(domain and terrain randomization)训练一个鲁棒的运动策略(locomotion policy)。
- 然后,使用部分对抗运动先验(partial adversarial motion prior),仅模仿(已训练运动策略的)下半身动作(lower-body motions)来学习移动操作策略(loco-manipulation policy)。
论文的核心创新点是提出了**部分模仿学习(partial imitation learning)**框架,用于将从一个任务(运动)中学到的风格迁移到另一个任务(推车移动操作)。其独特之处在于:
- **选择性模仿**:仅模仿源任务(运动)中与目标任务(移动操作)最相关的部分(如下半身动作),而不是全盘模仿,这有助于保持操作的灵活性。
- **利用对抗运动先验(adversarial motion prior)**:通过部分对抗运动先验来约束和引导新策略的学习,确保其运动风格与模仿源一致,同时允许上半身自由学习操作技能。
- 与需要同时学习运动和操作或进行完整模仿的基线方法相比,该方法通过解耦和迁移核心运动模式,实现了更稳定和准确的移动操作。
论文对该领域的整体贡献包括:
- 提出了一种新颖的部分模仿学习框架,用于高效地将运动技能迁移到移动操作任务中。
- 通过实验(在IsaacLab和MuJoCo中)证明,所学习的策略能够成功沿不同轨迹推车,并能有效跨仿真器迁移。
- 通过与多个基线方法的比较,验证了该方法能产生更稳定和准确的移动操作行为,为足式机器人的复杂操作任务学习提供了一种有效途径。