- 通用跨本体机器人能力仍然难以实现,主要受限于碎片化的基础设施
- 大多数机器人代码高度依赖于用户的具体设置,导致复用、回收或共享时产生巨大开销
- 研究背景:尽管有多任务、多本体数据集以及**视觉-语言-动作模型(VLA)** 训练方法的进展,但实际跨本体部署仍困难重重
- 提出**RIO (Robot I/O)** 开源Python框架,提供轻量级、灵活的组件用于机器人控制、遥操作、数据格式化、传感器配置和策略部署
- 通过抽象设计,允许用户针对不同硬件平台和形态自主选择组件,并在它们之间轻松切换,最小化重配置工作量
- 在三种形态(单臂、双臂、人形)和四个硬件平台(不同夹爪和相机)上验证了VLA部署工作流
- 使用基于RIO收集的遥操作数据,对**π₀.₅** 和**GR00T** 等先进VLA进行微调,完成拾放、折叠、刷碗等家庭任务
- **跨形态灵活性**:首次提供统一框架支持单臂、双臂、人形机器人等多种形态和异构硬件,实现真正的跨本体机器人学习
- **模块化与可切换性**:通过轻量级抽象,用户可自由选择并切换控制、遥操作、数据格式等组件,无需重构代码,大幅降低适配成本
- **端到端集成**:将遥操作数据收集与VLA微调无缝衔接,验证了从数据到策略部署的完整流程
- 为跨本体机器人学习提供了一种**开源、实时、灵活的I/O框架**,解决了基础设施碎片化问题
- 在多种形态和硬件平台上成功部署并微调VLA模型,展示了**泛化性和实用性**
- 通过开源代码和详细文档(含项目页面),促进社区在真实机器人硬件上加速学习研究