- 现有**可解释自动驾驶规划器(interpretable autonomous driving planners)** 依赖于生成解释,但在现实传感器退化(如噪声、光照、雾)下解释的可靠性尚未被充分验证
- **视觉-语言-动作模型(VLA)** 在自动驾驶中广泛应用,但其在传感器扰动下的鲁棒性缺乏系统性研究
- 需要量化**推理一致性(reasoning consistency)** 与**轨迹可靠性(trajectory reliability)** 之间的关系,以便设计更安全的监控机制
- 对**Alpamayo R1** (10B参数)VLA模型进行受控扰动研究,覆盖1,996个场景和8种传感器扰动(高斯噪声4种强度、2种光照极端、2种雾浓度),共约18,000次推理试验
- 引入**因果链(Chain-of-Causation, CoC)** 解释一致性作为度量,比较扰动前后解释的变化,并关联轨迹偏差
- 进行受控消融实验,对比启用与禁用CoC生成时的轨迹准确率,并使用**二列相关系数(point-biserial correlation)** 和**Cohen's d** 量化关联强度
- 分析退化模式:在不同噪声强度(σ ∈ {10,30,50,70})下拟合线性模型,评估标准输入预处理防御的效果
- **首次系统量化**:在传感器扰动下,**CoC解释一致性** 被证明是**轨迹可靠性** 的高保真指标(相关性r=0.99),当解释改变时轨迹偏差飙升5.3倍
- **发现推理与规划的强关联**:每个样本的CoC变化与轨迹偏差显著相关($r_{pb}=0.53$,Cohen's $d=1.12$),表明推理变化可直接反映规划风险
- **揭示退化的线性特征**:噪声强度与轨迹退化近似线性($R^2=0.957$),而传统输入预处理防御效果有限,为后续防御设计提供依据
- **提出基于推理的运行时监控**:利用CoC一致性作为规划安全的定量代理,替代传统仅依赖于输出质量的监控方法
- 为**VLA自动驾驶模型** 的鲁棒性评估提供了系统化扰动协议和基准(1,996场景、8种扰动)
- 建立了**CoC一致性** 作为规划安全量化代理的实证基础,推动更可靠的**基于推理的运行时监控(reasoning-based runtime monitoring)**
- 揭示了传感器退化下VLA推理的脆弱性,并证明启用因果链生成可显著提升轨迹准确率(平均11.8%,$p<0.0001$),为模型设计提供指导
- 提供了开源数据和评估方法,促进社区对**可解释规划器鲁棒性(xAI robustness in planning)** 的进一步研究