← 返回论文列表

使用黎曼特征和循环神经网络从肌电图解码高维手指运动
Decoding High-Dimensional Finger Motion from EMG Using Riemannian Features and RNNs

作者: Martin Colot, Cédric Simar, Guy Cheron 等5人
arXiv: 2604.22499v1
分类: cs.LG, cs.RO
📝 论文摘要
从前臂表面肌电信号(EMG)中连续估计高维手指运动学,可以实现对手部假肢、AR/XR接口和远程操作的自然控制。然而,人类手势的复杂性以及前臂肌肉的耦合作用,使得精确识别本身具有挑战性。现有方法通常依赖基于分类的机器学习来降低任务复杂度,从而限制了可控自由度并牺牲了自然交互。我们提出了一个仅使用消费级硬件的端到端连续EMG到运动学回归框架。该框架结合了8通道EMG臂带、单个网络摄像头和自动同步流程,能够收集EMG手指运动学数据集(EMG-FK)。该数据集包含10小时同步记录的EMG信号和15个手指关节角度数据,来自20名参与者执行丰富、无约束的右手动作。我们还引入了时间黎曼回归器(TRR),这是一种轻量级基于GRU的模型,利用多频带黎曼协方差特征序列来解码手指运动。在EMG-FK和公开的emg2pose基准测试中,TRR在受试者内和跨受试者评估中均优于最先进方法。在EMG-FK上,受试者内平均绝对误差达到$9.79°\pm 1.48$,跨受试者达到$16.71°\pm 3.57$。最后,我们展示了在树莓派5上的实时部署以及对机械手的直观控制;TRR以接近每秒10次的预测速度运行,比最先进方法快约一个数量级。这些贡献共同降低了可复现、实时基于EMG的高维手指运动解码的门槛,并为实现基于EMG的嵌入式系统更自然、直观的控制铺平了道路。

📊 核心分析

🎯 研究动机
- 连续估计高维手指运动学能够实现假肢、AR/XR交互和遥操作的**自然控制(natural control)**,但现有方法大多依赖基于分类的机器学习,限制可控自由度且牺牲自然交互 - 人类手势复杂性和前臂肌肉纠缠使得准确识别高维手指运动具有**本质挑战(intrinsically challenging)** - 现有方法缺乏使用消费级硬件进行**连续回归(continuous regression)**的端到端框架,且缺乏大规模同步数据集
🔧 核心方法
- 提出**端到端(end-to-end)框架**,结合8通道EMG臂带、单个网络摄像头和自动同步流程,构建了**EMG-FK数据集**(10小时,20名受试者,15个手指关节角度) - 引入**时间黎曼回归器(Temporal Riemannian Regressor, TRR)**,一种轻量级**门控循环单元(GRU)**模型,利用**多频段黎曼协方差特征(multi-band Riemannian covariance features)**序列解码手指运动 - 在EMG-FK和公共emg2pose基准上进行**受试者内(intra-subject)**和**跨受试者(cross-subject)**评估,并在Raspberry Pi 5上实现实时部署(约10次预测/秒)
💡 核心创新
- **首创性**:首次使用消费级硬件实现**连续EMG到运动学回归(continuous EMG-to-kinematics regression)**,避免分类限制,支持高维手指运动 - **特征创新**:提出**多频段黎曼协方差特征**结合GRU序列建模,有效捕获EMG时空结构,优于现有方法 - **效率提升**:TRR在嵌入式设备(Raspberry Pi 5)上运行速度比现有方法快一个数量级(~10 Hz),同时保持高精度 - **数据集价值**:提供大规模同步EMG-手指运动学数据集(EMG-FK),包含丰富非约束右手运动,促进可重复研究
🏆 总体贡献
- 为EMG解码领域提供了**低成本、高精度、实时**的高维手指运动估计框架,降低进入门槛 - 在EMG-FK和公共基准上,TRR在受试者内和跨受试者评估中均达到**最优性能(SOTA)**,验证了方法的泛化能力 - 展示了机器人手直观控制,证明了从消费级EMG到实际**嵌入式系统(embedded systems)**的可行性 - 开源数据集和框架促进**可重复研究(reproducible research)**,推动自然、直观的EMG控制交互发展