- 现有VLA(视觉-语言-动作)系统部署中,安全监控普遍采用**速度检查(velocity checking)** 等通用机制,但不同架构(离散vs连续)的失败模式差异未被系统理解
- 研究背景:VLA架构(如**VQ-BeT**、**Diffusion Policy**、**ACT**)在电机指令层面失败方式是否可预测、是否具有架构特异性尚不清楚
- 在**PushT** 和**ALOHA 14-DOF双臂操作** 任务上,对三种VLA架构(VQ-BeT、Diffusion Policy、ACT)执行相同的评估协议(n=450 episodes)
- 提取**方向反转率(direction reversal rate)**、**加加速度(jerk)**、**速度违规(velocity violations)** 等特征,用AUROC和p值评估其作为失败预测器的有效性
- 提出**SafeContract** 工具:无需训练(training-free)的黑盒动作监控框架,采用**共形校准(conformal calibration)** 保证可靠性
- **发现架构特异性失败签名**:方向反转率是三种架构通用的失败预测器(AUROC≥0.79),但jerk仅对离散令牌架构有效(AUROC梯度0.88→0.69→0.41),速度违规在所有架构中均无效(AUROC 0.41-0.69)
- **揭示监控选择的必要性**:证明没有单一监控器能通用,必须根据VLA的离散/连续家族选择架构匹配(architecture-matched)的监控器
- **量化了离散/连续VLA区分的监控后果**:连续族VLA(ACT、Diffusion)的速度监控几乎无预测信号(AUROC≈0.52/0.41),而常见部署代码错误地依赖速度检查
- 为**VLA安全部署** 提供了系统性知识:不同架构产生定性不同的失败模式,需针对性设计监控器
- 指出当前最常用的**速度检查(velocity checking)** 机制在大多数VLA架构中无效,纠正了实践中的错误假设
- 开源了**SafeContract** 工具和代码(GitHub),支持无需训练的、架构感知的**黑盒动作监控(black-box action monitoring)**,促进社区复现与后续研究