- 磁驱动微机器人(magnetically actuated microrobot)在微尺度非接触操作中具有前景,但存在间接驱动、传感有限和非线性磁交互等控制挑战
- 双臂协调能够实现单臂难以完成的微机器人重新定向(reorientation),但引入了共享工作空间内的耦合控制难题,策略需生成两个执行器的协调轨迹
- 现有方法难以同时应对非线性磁场交互和双臂协同的时序控制需求,缺乏层次化建模方案
- 提出**Mag-VLA** 框架,基于**Qwen2.5-VL-7B** 视觉-语言骨干,使用**低秩适配(Low-Rank Adaptation, LoRA)** 进行参数高效微调,处理视觉观测和语言指令以预测动作
- 引入**运动感知相分类器(motion-aware phase classifier)** 识别任务进展阶段,并结合**相条件动作分块Transformer(Phase-conditioned Action Chunking Transformer, ACT)** 解码器生成时序连贯的多步控制序列
- 构建**遥操作数据集(teleoperated dataset)** 覆盖三种任务配置,用于训练和评估
- **首创性**:首次将**视觉-语言-动作(Vision-Language-Action, VLA)** 层次化建模应用于磁驱动微机器人双臂灵巧操作,实现复杂任务(如重新定向)
- **结构创新**:提出**运动感知相分类器** 动态感知任务阶段,配合**相条件ACT解码器** 生成时序一致的动作块,优于其他生成式动作头(如直接回归)
- **实验验证**:在真实机器人上达到90%接近成功率和80%/70%/50%(按难度递增)的运输成功率,证明层次化VLA框架的有效性
- 为磁驱动微机器人操作提供了一种**分层VLA建模(hierarchical VLA modeling)** 新范式,整合视觉、语言和时序动作生成
- 通过消融实验证实**动作分块Transformer(ACT)** 在微机器人控制中的优越性,指导后续动作头设计
- 构建并公开(隐含)**遥操作数据集**,填补磁微机器人灵巧操作数据空白,促进该领域可复现研究