- 机器人仿真环境生成是仿真机器人学习的**瓶颈(bottleneck)**,构建可训练的MuJoCo场景需要3D资产建模、MJCF规范、空间布局、碰撞避免和机器人模型集成等专业知识
- 现有方法依赖手工劳动和专家知识,缺乏从自然语言直接生成物理有效场景的自动化系统
- 用户难以快速创建多样化的机器人训练环境,限制了仿真学习的规模化应用
- 提出**SR-Platform**,一种**agentic pipeline**,将场景合成分解为四个阶段:**LLM-based orchestrator** 将用户意图转换为结构化场景计划;**asset forge** 通过LLM-to-CadQuery合成检索缓存资产或生成新3D几何;**layout architect** 分配物体姿态并验证工业约束;**bridge layer** 组装最终MJCF场景并合并机器人模型
- 系统部署为九个服务的**Docker stack**,包含WebSocket进度流、MinIO网格存储、Qdrant语义资产检索、Redis作业状态和InfluxDB遥测
- 采用**缓存加速(cache acceleration)** 机制,通过语义检索重复使用已有资产,减少每物体的LLM调用
- **端到端自然语言驱动**:首次将**agentic系统(agentic system)** 应用于从自由形式自然语言直接生成可执行的物理有效MuJoCo仿真环境,无需人工专家干预
- **分解式流水线**:将场景合成划分为四个专业化阶段,每个阶段由LLM驱动并具有自动恢复机制(asset forge的11.3%首次重试率)
- **缓存加速**:通过**语义资产检索(Qdrant)** 和缓存重用,为之前生成的物体类型消除每物体的LLM调用,显著降低延迟(缓存场景30-40s vs 非缓存50s)
- **生产级部署架构**:作为九服务Docker栈部署,支持流式进度和遥测监控,具备工业实用性和可扩展性
- 为机器人学习领域提供了一种**自然语言驱动的仿真环境合成范式**,大幅降低创建多样训练环境的手工工作量
- 通过30天生产数据验证,**系统性能** 达到中位约50秒生成五物体场景,且缓存加速后约30-40秒,首次重试率11.3%,证明了方法的有效性和可靠性
- 提供了完整的Docker栈部署方案和技术细节,促进社区复现与后续研究