- 现有人形机器人全身控制器通常需要**密集的运动学或空间参考(dense kinematic/spatial references)**,而规划器难以从任务语义中合成这些参考
- 现有接口不够紧凑、直观和通用,限制了从高层任务规划到低层控制的衔接效率
- 研究背景:人形机器人在真实世界部署需要一种简洁、模块化且表达能力强的命令空间(command space)接口
- 提出**HANDOFF** 框架:一个单一的人形全身控制器,通过**多教师KL蒸馏(multi-teacher KL distillation)** 将三个互补专家教师整合为**混合专家学生(mixture-of-experts student)**
- 三个专家教师分别为:**全身运动跟踪(whole-body motion tracking)** (使用安全过滤数据)、**行走(locomotion)**、**跌倒恢复(fall-recovery)**
- 采用**上下文条件门控机制(context-conditioned gating scheme)** 动态选择专家输出,学生模型学习融合不同技能
- 定义紧凑显式的**任务空间接口(task-space interface)**,作为任务规划与全身控制之间的媒介
- **首创紧凑显式接口**:提出一种直观、通用、模块化且表达力强的命令空间,无需密集参考即可连接任务语义与全身控制
- **多教师蒸馏策略**:首次将全身运动跟踪、行走和跌倒恢复三个互补专家通过KL散度蒸馏至单一学生模型,实现技能融合
- **无需任务特定数据或微调**:结合**VLM驱动的智能体规划器(VLM-driven agentic planner)**,直接通过自然语言驱动任务执行,展示了强大的泛化能力
- 为**人形机器人全身控制(humanoid whole-body control)** 提供了一种新颖的**任务空间接口范式(task-space interface paradigm)**,使任务规划更高效
- 在Unitree G1平台上,HANDOFF匹配最先进的速率跟踪性能,并实现最大的鲁棒操作工作空间之一
- 通过硬件实验验证了自然语言驱动任务滚动的可行性,展示了零样本迁移能力,为通用人形操作奠定了基础