- **触觉强化学习(tactile-based RL)** 当前面临研究碎片化、过度关注已饱和的**方向任务(orientation tasks)** 的问题
- 缺乏统一的标准基准来评估不同机器人形态下的触觉操作能力
- 现有基准未充分利用**GPU并行化(GPU-parallelised)** 加速训练和评估
- 提出 **roto 2.0**,一个**GPU并行化(GPU-parallelised)** 的基准测试平台,覆盖四种不同机器人形态(16-DOF到24-DOF)
- 采用**端到端“盲”操控(end-to-end blind manipulation)** 范式,仅依赖**本体感觉(proprioception)** 和**触觉感知(tactile sensing)**,不使用状态信息或知识蒸馏
- 基于**强化学习(reinforcement learning)** 训练智能体,并开源了经过稳健调优的基线环境
- **专注盲操作**:区别于现有触觉基准,完全摒弃视觉或外部状态信息,探索纯触觉和本体感觉的极限
- **数量级性能提升**:盲智能体在**10秒内实现13次保定球旋转(Baoding ball rotations)**,比当前SOTA快一个数量级
- **低门槛开源**:开源环境与调优基线,研究者无需投入大量时间进行繁琐的RL调参,可直接聚焦算法创新
- 为**触觉强化学习(tactile-based RL)** 领域提供了标准化、可扩展的基准测试平台
- 验证了**纯触觉盲操控** 在复杂操作任务上的可行性,并展示了远超预期的性能
- 降低了触觉RL研究门槛,促进社区对**核心算法挑战** (而非工程调优)的探索