该论文旨在解决人形机器人(humanoid robots)在执行多种运动技能时,难以在不同技能之间实现灵活、安全、实时切换的问题。现有基于深度强化学习(deep reinforcement learning)的全身控制(whole-body control)方法虽然在单一技能上取得了显著进展,但在技能过渡方面存在局限,导致安全风险和实践限制。
论文提出了一个名为Switch的分层多技能系统,包含三个关键组件:
- 技能图(Skill Graph, SG):基于多技能运动数据的运动学相似性(kinematic similarity),建立潜在跨技能过渡路径。
- 全身跟踪策略(whole-body tracking policy):基于技能图,通过深度强化学习训练,用于跟踪目标运动。
- 在线技能调度器(online skill scheduler):驱动跟踪策略执行技能,并在需要切换技能或出现显著跟踪偏差时,通过在线图搜索(online graph search)寻找最优可行路径,确保鲁棒执行和平滑过渡。
论文的核心创新在于提出了一种基于技能图(Skill Graph)的层次化框架,实现了人形机器人运动技能的任意时刻无缝切换(seamless skill transitions)。与现有工作相比,其独特之处在于:
- 通过技能图显式建模技能间的运动学相似性,为在线搜索高效过渡路径提供了结构化表示。
- 将技能调度问题形式化为在线图搜索,能够在运行时动态决策最优切换路径,确保实时性、稳定性和高效性。
- 整个系统实现了技能执行与过渡的联合优化,克服了传统方法在灵活过渡方面的瓶颈。
论文对该领域的整体贡献包括:
- 提出了一个完整的分层系统(Switch),首次实现了人形机器人多种运动技能的敏捷、实时、任意时刻切换。
- 通过技能图和在线调度器的结合,为多技能切换问题提供了一个可扩展、鲁棒的解决方案框架。
- 全面的实验验证表明,该系统在保持高运动模仿性能的同时,能以高成功率执行敏捷的技能过渡,推动了人形机器人向更灵活、实用的方向发展。