该论文旨在解决现有仿人机器人乒乓球系统的两个核心局限:
- 依赖外部传感设备,无法实现完全自主的部署
- 缺乏敏捷的全身协调能力,难以执行精确的任务
研究背景是现有系统在快速机器人运动下难以实现低延迟、鲁棒的机载自我中心感知,以及缺乏足够多样化的任务对齐击球动作来学习精确自然的全身行为。
论文提出了一个名为SMASH的模块化系统,主要技术包括:
- 将可扩展的全身技能学习与机载自我中心感知(egocentric perception)相统一
- 采用紧密协调的全身控制(whole-body control),而非分离的上半身和下半身行为
- 使用生成模型(generative model)来增强和多样化击球动作,获得可扩展的运动先验(motion priors)
- 完全依靠机载传感器实现连续击球,克服低延迟感知、自我运动引起的不稳定性和有限视野等挑战
论文的核心创新点体现在三个方面:
1. **全身协调控制创新**:实现了紧密协调的全身控制,使系统能够展示多样化的击球动作(如爆发性全身扣杀和低蹲击球),而非依赖分离的上半身和下半身行为
2. **运动生成创新**:通过生成模型增强和多样化击球动作,利用可扩展的运动先验,在广泛工作空间内产生自然、鲁棒的击球行为
3. **感知系统创新**:首次展示了完全依靠机载感知实现连续击球的仿人机器人乒乓球系统,克服了低延迟感知、自我运动不稳定性和有限视野等多重挑战
论文对该领域的整体贡献包括:
- 提出了一个统一的模块化系统,将可扩展的全身技能学习与机载自我中心感知相结合,消除了部署时对外部摄像头的依赖
- 通过大量真实世界实验验证了系统在高速条件下的稳定精确球交换能力
- 为动态仿人机器人交互任务的可扩展、感知驱动的全身技能学习提供了有效验证,推动了自主机器人系统的发展