利用本体感知变换器从关节传感器学习鲁棒的灵巧手内操作

📝 论文摘要

手内物体操作是灵巧机器人一项基础但具有挑战性的能力。尽管灵巧操作取得了显著进展，现有方法严重依赖视觉或触觉感知来跟踪物体状态，而关节感知——所有机械手上最容易获得的感知模式——在很大程度上被忽视，尤其在腱驱动手中。本文通过提出以下问题来探究仅凭关节感知能走多远：(i) 电机编码器还是直接关节感知能提供更好的本体感觉反馈，(ii) 如何从关节测量中提取环境信息，(iii) 仅依赖关节控制的策略能否在没有外部感知的情况下实现具有竞争力的实际性能。我们提出了本体感知Transformer（PT），一种在腱驱动灵巧手上实现连续立方体旋转的无外部感知方法，仅使用关节感知反馈。首先通过带特权物体信息的强化学习训练教师策略，然后将其蒸馏到仅依赖关节位置和速度历史记录的PT中。Transformer架构有效地从关节传感器读数的时序模式中提取隐式物体状态信息。在真实ORCA手上的实验表明，我们的方法旋转速度比基线快3.1倍。我们还证明，PT在立方体位置估计上的均方根误差比MLP基线低23.4%，表明从本体感知源中提取外部感知信息的能力更强。

🎯 研究动机

- 灵巧手内操作(in-hand manipulation)是灵巧机器人的基础挑战，现有方法严重依赖**视觉(vision)** 或**触觉(tactile)** 感知来跟踪物体状态 - **关节传感(joint sensing)** 作为最易获取的模态（尤其在**腱驱动(tendon-driven)** 手上）却被极大忽视 - 论文探究三个问题：(i)电机编码器与直接关节传感哪个提供更好的本体反馈；(ii)如何从关节测量中提取环境信息；(iii)仅靠关节控制能否达到有竞争力的实际性能

🔧 核心方法

- 提出**本体感知Transformer(Proprioceptive Transformer, PT)**，一种无外感受(exteroceptive-free)方法，仅使用关节位置和速度历史实现连续立方体旋转 - 采用**教师-学生蒸馏(teacher-student distillation)** 框架：教师策略通过**强化学习(reinforcement learning)** 训练，享有特权物体信息；学生PT仅依赖关节传感序列 - 利用**Transformer架构(Transformer architecture)** 从关节读数的时序模式中提取隐式物体状态信息

💡 核心创新

- **首次仅用关节传感** 实现腱驱动灵巧手的鲁棒内操作，完全摆脱视觉或触觉外部感知 - **教师-学生蒸馏范式** 将特权信息下的强化学习策略蒸馏为纯本体感知策略，实现自监督迁移 - **Transformer时序建模** 有效替代传统MLP，从关节位置/速度历史中挖掘外感受信息，且位置估计RMSE比MLP基线低23.4%

🏆 总体贡献

- 证明了仅靠**关节传感(joint sensing)** 即可在真实的腱驱动手上完成有挑战的灵巧操作任务，颠覆了对外部感知的依赖 - 在ORCA真实手上实现旋转速度比基线**快3.1倍**，立方体位置估计误差降低**23.4%**，树立了新的性能标杆 - 为低成本、无视觉/触觉的灵巧操作提供可行方案，拓宽了实际部署场景

利用本体感知变换器从关节传感器学习鲁棒的灵巧手内操作
Learning Robust Dexterous In-Hand Manipulation from Joint Sensors with Proprioceptive Transformer

📊 核心分析

利用本体感知变换器从关节传感器学习鲁棒的灵巧手内操作 Learning Robust Dexterous In-Hand Manipulation from Joint Sensors with Proprioceptive Transformer

📊 核心分析

利用本体感知变换器从关节传感器学习鲁棒的灵巧手内操作
Learning Robust Dexterous In-Hand Manipulation from Joint Sensors with Proprioceptive Transformer