← 返回论文列表

利用从婴儿到类人机器人的运动重定向模拟婴儿第一人称感知运动体验
Simulating Infant First-Person Sensorimotor Experience via Motion Retargeting from Babies to Humanoids

作者: Francisco M. López, Hoshinori Kanazawa, Ondrej Fiala 等11人
arXiv: 2604.27583v1
分类: q-bio.NC, cs.RO
📝 论文摘要
随着类人机器人能力的增强,将人类动作迁移至类人智能体变得日益重要。然而,现有方法大多仅关注运动学重现,而忽略了与人类动作相关的丰富感觉运动经验。本文提出一个利用物理和虚拟类人机器人模拟婴儿多模态感觉运动经验的框架。通过单一视频,该方法提取婴儿骨骼结构并估计每帧的全三维姿态,进而重建其身体构型。随后,我们将重建的动作映射至多个发育平台:实体iCub机器人以及虚拟仿真器pyCub、EMFANT和MIMo。在这些具身平台上回放迁移后的动作,可生成模拟的多感官流,包括本体感觉(关节与肌肉)、触觉和视觉。对于最佳匹配的具身平台,该迁移方法达到亚厘米级精度,并可实现婴儿发育的丰富多模态分析以及增强的行为自动标注。该框架为观察婴儿的感觉运动经验提供了独特窗口,为机器人学、发展科学以及神经发育障碍的早期检测提供了新工具。代码开源在 https://github.com/ctu-vras/motion-retargeting/。

📊 核心分析

🎯 研究动机
- 现有**运动重定向(motion retargeting)** 方法仅关注**运动学(kinematics)** 重现,忽略了与人体运动相关的丰富**感知运动体验(sensorimotor experience)** - 研究背景:随着**人形机器人(humanoid robots)** 能力增强,从人类到类人机器人的运动重定向日益重要,但缺乏多模态感知模拟 - 需要一种能够从单视频重建婴儿运动并模拟其**本体感觉(proprioception)**、**触觉(touch)** 和**视觉(vision)** 等感知流的方法
🔧 核心方法
- 从单一视频中提取婴儿**骨骼结构(skeletal structure)** 并估计**完整3D姿态(full 3D pose)**,重建婴儿身体配置 - 将重建的运动映射到多个发育平台:物理**iCub机器人** 和虚拟模拟器**pyCub**、**EMFANT**、**MIMo** - 在重定向的运动重放过程中,产生模拟的**多感官流(multisensory streams)**,包括本体感觉(关节和肌肉)、触觉和视觉
💡 核心创新
- **首次** 实现从婴儿到人形机器人的**多模态运动重定向(multimodal motion retargeting)**,不仅重现运动学,还模拟感知运动体验 - 支持多种**物理和虚拟人形平台(physical and virtual humanoids)** 的统一框架,实现跨平台比较 - 对于最佳匹配实体,达到**亚厘米精度(sub-centimeter accuracy)**,并实现丰富的**多模态发育分析(multimodal analysis of infant development)** 和自动化行为标注
🏆 总体贡献
- 为**机器人学**、**发育科学(developmental science)** 和**神经发育障碍早期检测(early detection of neurodevelopmental disorders)** 提供了新工具 - 提供观察婴儿**感知运动体验(sensorimotor experience)** 的独特窗口,促进发育研究 - 开源代码(GitHub)促进复现与后续研究,推动**认知发育机器人(cognitive developmental robotics)** 领域发展