具身可解释性：将因果理解与视觉-语言-动作模型中的泛化联系起来

📝 论文摘要

视觉-语言-动作（VLA）策略在分布偏移下常常失效，这表明决策可能依赖于虚假的视觉相关性而非任务相关因果因素。我们将视觉动作归因问题形式化为一个干预估计问题。据此，我们提出了干预显著性评分（ISS），这是一种用于估计视觉区域对动作预测因果影响的干预掩蔽方法，以及干扰质量比（NMR），这是一种衡量对任务无关特征归因程度的标量指标。我们分析了ISS的统计特性，表明它可以实现无偏估计，并刻画了动作预测误差可以作为因果影响有效代理的条件。跨多种操作任务的实验表明，NMR能够预测泛化行为，且ISS比现有的可解释性方法能提供更可靠的解释。这些结果表明，干预归因为识别具身策略中的因果错配提供了一种简单的诊断方法。

🎯 研究动机

- 现有**视觉-语言-动作(VLA)** 模型在**分布偏移(distribution shift)** 下常失败，因为决策可能依赖**虚假视觉相关性(spurious visual correlations)** 而非任务相关原因 - 缺乏有效方法诊断**因果失调(causal misalignment)**，即模型是否真正关注任务相关的视觉区域 - 需要一种**干预性(interventional)** 归因方法，从因果角度理解VLA决策机制

🔧 核心方法

- 提出**干预显著性分数(Interventional Significance Score, ISS)**，一种**干预掩蔽(interventional masking)** 程序，用于估计视觉区域对动作预测的**因果影响(causal influence)** - 提出**干扰质量比(Nuisance Mass Ratio, NMR)**，标量度量，衡量对**任务无关特征(task-irrelevant features)** 的归因程度 - 理论分析表明ISS可进行**无偏估计(unbiased estimation)**，并刻画了**动作预测误差(action prediction error)** 作为因果影响有效代理的条件

💡 核心创新

- **首创性**：将视觉-动作归因形式化为**干预估计(interventional estimation)** 问题，区别于现有基于相关性或梯度的可解释性方法 - **因果诊断**：通过NMR量化模型对无关特征的依赖程度，从而预测**泛化行为(generalization behavior)** - **统计保证**：证明ISS无偏性，并提供代理有效性条件，增强归因的**理论可靠性(theoretical reliability)**

🏆 总体贡献

- 为**具身策略(embodied policies)** 提供了一种**简单诊断方法(simple diagnostic approach)**，用于识别因果失调 - 实验表明ISS比现有可解释性方法产生更**忠实的解释(faithful explanations)**，NMR能预测泛化性能 - 推动了**具身可解释性(embodied interpretability)** 领域发展，建立了因果理解与泛化之间的直接联系

具身可解释性：将因果理解与视觉-语言-动作模型中的泛化联系起来
Embodied Interpretability: Linking Causal Understanding to Generalization in Vision-Language-Action Models

📊 核心分析

具身可解释性：将因果理解与视觉-语言-动作模型中的泛化联系起来 Embodied Interpretability: Linking Causal Understanding to Generalization in Vision-Language-Action Models

📊 核心分析

具身可解释性：将因果理解与视觉-语言-动作模型中的泛化联系起来
Embodied Interpretability: Linking Causal Understanding to Generalization in Vision-Language-Action Models