SMASH：基于自我中心视觉的人形机器人乒乓球可扩展全身技能掌握

📝 论文摘要

现有的人形机器人乒乓球系统仍受限于对外部感知的依赖，以及无法实现敏捷的全身协调以完成精确任务执行。这些局限源于两大核心挑战：在机器人快速运动下实现低延迟且鲁棒的自体中心感知，以及获取足够多样化的任务对齐击球动作，以学习精确而自然的全身行为。本文提出\methodname，一个模块化的人形机器人乒乓球系统，它将可扩展的全身技能学习与机载自体中心感知相结合，从而在部署时无需依赖外部摄像头。我们的研究在三个关键方面推进了现有的人形机器人乒乓球系统。首先，我们通过紧密协调的全身控制实现了敏捷而精确的球体交互，而非依赖分离的上半身与下半身行为。这使得系统能够展示多样化的击球动作，包括爆发性的全身扣杀和低姿态的蹲伏击球。其次，通过使用生成模型增强和多样化击球动作，我们的框架受益于可扩展的运动先验，并在广泛的工作空间中产生自然、鲁棒的击球行为。第三，据我们所知，我们首次展示了仅依靠机载感知即可实现连续击球的人形机器人乒乓球系统，尽管面临低延迟感知、自身运动引起的不稳定性以及有限视野等挑战。大量真实世界实验表明，系统在高速条件下能够实现稳定而精确的球体交换，验证了针对动态人形交互任务的可扩展、感知驱动的全身技能学习方法的有效性。

🎯 研究动机

该论文旨在解决现有仿人机器人乒乓球系统的两个核心局限： - 依赖外部传感设备，无法实现完全自主的部署 - 缺乏敏捷的全身协调能力，难以执行精确的任务研究背景是现有系统在快速机器人运动下难以实现低延迟、鲁棒的机载自我中心感知，以及缺乏足够多样化的任务对齐击球动作来学习精确自然的全身行为。

🔧 核心方法

论文提出了一个名为SMASH的模块化系统，主要技术包括： - 将可扩展的全身技能学习与机载自我中心感知(egocentric perception)相统一 - 采用紧密协调的全身控制(whole-body control)，而非分离的上半身和下半身行为 - 使用生成模型(generative model)来增强和多样化击球动作，获得可扩展的运动先验(motion priors) - 完全依靠机载传感器实现连续击球，克服低延迟感知、自我运动引起的不稳定性和有限视野等挑战

💡 核心创新

论文的核心创新点体现在三个方面： 1. **全身协调控制创新**：实现了紧密协调的全身控制，使系统能够展示多样化的击球动作（如爆发性全身扣杀和低蹲击球），而非依赖分离的上半身和下半身行为 2. **运动生成创新**：通过生成模型增强和多样化击球动作，利用可扩展的运动先验，在广泛工作空间内产生自然、鲁棒的击球行为 3. **感知系统创新**：首次展示了完全依靠机载感知实现连续击球的仿人机器人乒乓球系统，克服了低延迟感知、自我运动不稳定性和有限视野等多重挑战

🏆 总体贡献

论文对该领域的整体贡献包括： - 提出了一个统一的模块化系统，将可扩展的全身技能学习与机载自我中心感知相结合，消除了部署时对外部摄像头的依赖 - 通过大量真实世界实验验证了系统在高速条件下的稳定精确球交换能力 - 为动态仿人机器人交互任务的可扩展、感知驱动的全身技能学习提供了有效验证，推动了自主机器人系统的发展

SMASH：基于自我中心视觉的人形机器人乒乓球可扩展全身技能掌握
SMASH: Mastering Scalable Whole-Body Skills for Humanoid Ping-Pong with Egocentric Vision

📊 核心分析

SMASH：基于自我中心视觉的人形机器人乒乓球可扩展全身技能掌握 SMASH: Mastering Scalable Whole-Body Skills for Humanoid Ping-Pong with Egocentric Vision

📊 核心分析

SMASH：基于自我中心视觉的人形机器人乒乓球可扩展全身技能掌握
SMASH: Mastering Scalable Whole-Body Skills for Humanoid Ping-Pong with Egocentric Vision