← 返回论文列表

roto 2.0:机器人触觉奥林匹克
roto 2.0: The Robot Tactile Olympiad

作者: Elle Miller, Jayaram Reddy, Ayush Deshmukh 等7人
arXiv: 2605.21429v1
分类: cs.RO, cs.LG
📝 论文摘要
目前,基于触觉的强化学习(RL)受到研究碎片化和对过度饱和定向任务关注的阻碍。我们推出了机器人触觉奥林匹克竞赛第二版(\texttt{roto 2.0})——一个GPU并行化的基准测试,旨在跨四种不同的机器人形态(16自由度至24自由度)标准化基于触觉的强化学习。与以往的基准不同,roto专注于端到端的“盲”操作,仅利用本体感觉和触觉感知,无需状态信息或蒸馏。我们展示了显著的性能提升:我们的盲操作智能体在10秒内完成了13次保定球旋转,比当前最先进的速度快一个数量级。通过开源我们的环境和经过稳健调优的基线,我们降低了入门门槛,使研究人员能够优先处理基础算法挑战,而非繁琐的强化学习调优。网站:https://elle-miller.github.io/roto/

📊 核心分析

🎯 研究动机
- **触觉强化学习(tactile-based RL)** 当前面临研究碎片化、过度关注已饱和的**方向任务(orientation tasks)** 的问题 - 缺乏统一的标准基准来评估不同机器人形态下的触觉操作能力 - 现有基准未充分利用**GPU并行化(GPU-parallelised)** 加速训练和评估
🔧 核心方法
- 提出 **roto 2.0**,一个**GPU并行化(GPU-parallelised)** 的基准测试平台,覆盖四种不同机器人形态(16-DOF到24-DOF) - 采用**端到端“盲”操控(end-to-end blind manipulation)** 范式,仅依赖**本体感觉(proprioception)** 和**触觉感知(tactile sensing)**,不使用状态信息或知识蒸馏 - 基于**强化学习(reinforcement learning)** 训练智能体,并开源了经过稳健调优的基线环境
💡 核心创新
- **专注盲操作**:区别于现有触觉基准,完全摒弃视觉或外部状态信息,探索纯触觉和本体感觉的极限 - **数量级性能提升**:盲智能体在**10秒内实现13次保定球旋转(Baoding ball rotations)**,比当前SOTA快一个数量级 - **低门槛开源**:开源环境与调优基线,研究者无需投入大量时间进行繁琐的RL调参,可直接聚焦算法创新
🏆 总体贡献
- 为**触觉强化学习(tactile-based RL)** 领域提供了标准化、可扩展的基准测试平台 - 验证了**纯触觉盲操控** 在复杂操作任务上的可行性,并展示了远超预期的性能 - 降低了触觉RL研究门槛,促进社区对**核心算法挑战** (而非工程调优)的探索