← 返回论文列表

具身可解释性:将因果理解与视觉-语言-动作模型中的泛化联系起来
Embodied Interpretability: Linking Causal Understanding to Generalization in Vision-Language-Action Models

作者: Hanxin Zhang, Mingshuo Xu, Abdulqader Dhafer 等6人
arXiv: 2605.00321v1
分类: cs.RO
📝 论文摘要
视觉-语言-动作(VLA)策略在分布偏移下常常失效,这表明决策可能依赖于虚假的视觉相关性而非任务相关因果因素。我们将视觉动作归因问题形式化为一个干预估计问题。据此,我们提出了干预显著性评分(ISS),这是一种用于估计视觉区域对动作预测因果影响的干预掩蔽方法,以及干扰质量比(NMR),这是一种衡量对任务无关特征归因程度的标量指标。我们分析了ISS的统计特性,表明它可以实现无偏估计,并刻画了动作预测误差可以作为因果影响有效代理的条件。跨多种操作任务的实验表明,NMR能够预测泛化行为,且ISS比现有的可解释性方法能提供更可靠的解释。这些结果表明,干预归因为识别具身策略中的因果错配提供了一种简单的诊断方法。

📊 核心分析

🎯 研究动机
- 现有**视觉-语言-动作(VLA)** 模型在**分布偏移(distribution shift)** 下常失败,因为决策可能依赖**虚假视觉相关性(spurious visual correlations)** 而非任务相关原因 - 缺乏有效方法诊断**因果失调(causal misalignment)**,即模型是否真正关注任务相关的视觉区域 - 需要一种**干预性(interventional)** 归因方法,从因果角度理解VLA决策机制
🔧 核心方法
- 提出**干预显著性分数(Interventional Significance Score, ISS)**,一种**干预掩蔽(interventional masking)** 程序,用于估计视觉区域对动作预测的**因果影响(causal influence)** - 提出**干扰质量比(Nuisance Mass Ratio, NMR)**,标量度量,衡量对**任务无关特征(task-irrelevant features)** 的归因程度 - 理论分析表明ISS可进行**无偏估计(unbiased estimation)**,并刻画了**动作预测误差(action prediction error)** 作为因果影响有效代理的条件
💡 核心创新
- **首创性**:将视觉-动作归因形式化为**干预估计(interventional estimation)** 问题,区别于现有基于相关性或梯度的可解释性方法 - **因果诊断**:通过NMR量化模型对无关特征的依赖程度,从而预测**泛化行为(generalization behavior)** - **统计保证**:证明ISS无偏性,并提供代理有效性条件,增强归因的**理论可靠性(theoretical reliability)**
🏆 总体贡献
- 为**具身策略(embodied policies)** 提供了一种**简单诊断方法(simple diagnostic approach)**,用于识别因果失调 - 实验表明ISS比现有可解释性方法产生更**忠实的解释(faithful explanations)**,NMR能预测泛化性能 - 推动了**具身可解释性(embodied interpretability)** 领域发展,建立了因果理解与泛化之间的直接联系