该论文旨在解决机器人策略学习中的现实数据稀缺问题。研究背景是:在真实环境中学习鲁棒的机器人策略需要多样化的数据增强,但由于物理资产获取和环境重新配置的成本高昂,扩展真实世界数据收集非常困难。
论文提出了一个生成式框架,具体包括:
- 建立从真实世界全景图到高保真仿真场景的生成式 真实到仿真(real-to-sim) 映射
- 通过语义和几何编辑合成多样化的 表亲场景(cousin scenes)
- 结合高质量物理引擎和真实资产,支持交互式操作任务
- 采用 多房间缝合(multi-room stitching) 技术构建一致的大规模环境,用于跨复杂布局的长时程导航
论文的核心创新是提出了 数字表亲(Digital Cousins) 这一概念和生成框架,其独特之处在于:
- 与现有工作相比,它不仅进行简单的场景重建,而是通过生成式方法创建语义和几何上多样化的 表亲场景,极大地扩展了数据多样性
- 将 真实到仿真(real-to-sim) 映射与场景编辑、多房间缝合相结合,构建了支持交互操作和长时程导航的完整仿真平台
- 通过大规模数据生成验证了 仿真到真实(sim-to-real) 相关性,并证明数据规模扩展能显著提升对未见场景和物体变化的泛化能力
论文对该领域的整体贡献包括:
- 提出了一个完整的生成式高保真仿真框架,用于可泛化的机器人学习和评估
- 通过实验验证了平台的高保真度和 仿真到真实(sim-to-real) 相关性
- 证明了大规模数据生成能有效提升机器人策略对未见场景变化的泛化能力
- 为机器人学习提供了一个高效、可扩展的数据增强和评估平台