← 返回论文列表

未来是兼容的吗?诊断世界行动模型中的动态一致性
Is the Future Compatible? Diagnosing Dynamic Consistency in World Action Models

作者: Bo-Kai Ruan, Teng-Fang Hsiao, Ling Lo 等4人
arXiv: 2605.07514v1
分类: cs.RO, cs.CV
📝 论文摘要
世界行动模型(WAMs)通过预测未来观测和行动,借助想象展开实现决策制定。然而,这些想象未来的可靠性仍未得到充分检验:生成的未来仅仅是视觉上合理,还是与其声称建模的行动序列在动力学上一致?在本研究中,我们识别出行动-状态一致性,即预测行动与诱导状态转移之间的对齐程度,作为WAMs缺失的一个可靠性维度。通过对代表性联合预测模型和逆动力学模型的系统性研究,我们发现行动-状态一致性在许多任务中系统性地区分了成功与失败的展开,并与学习到的价值估计呈现出相似的成功-失败趋势。这些结果表明,一致性捕捉到了超越视觉真实性的决策相关结构。我们进一步识别出背景坍塌作为一个重要的边界条件,其中低动力学失败轨迹可能具有欺骗性的一致性,因为静态未来更容易预测。基于这些发现,我们引入了一种免于价值的共识策略用于测试时选择,该策略通过预测未来之间的一致性对候选展开进行排序。该策略在无需额外训练或奖励建模的情况下,提升了RoboCasa和RoboTwin 2.0上的成功率。综上所述,我们的发现将行动-状态一致性确立为评估WAM可靠性的诊断工具,以及免于价值规划的实用信号。

📊 核心分析

🎯 研究动机
- 现有**世界动作模型(World Action Model, WAM)** 主要通过预测未来观察和动作进行决策,但生成的未来序列的**可靠性** 缺乏系统评估 - 已有的评估侧重**视觉真实性(visual realism)**,忽略了预测动作与状态转换之间的**动态一致性(dynamic consistency)** - 研究背景:WAM在机器人、游戏等领域应用广泛,但失败轨迹可能因视觉逼真而误判为有效,需要新的诊断维度
🔧 核心方法
- 对代表性**联合预测模型(joint-prediction model)** 和**逆动力学模型(inverse-dynamics model)** 进行系统性实验,测量**动作-状态一致性(action-state consistency)** - 通过对比成功与失败rollout的consistency值,揭示其与**价值估计(value estimate)** 的相似趋势 - 提出**无价值共识策略(value-free consensus strategy)**,在测试时对多个候选rollout按未来预测的一致性进行排序和选择
💡 核心创新
- **首次提出** 动作-状态一致性(action-state consistency)作为WAM可靠性的关键指标,超越视觉真实性 - 识别**背景坍缩(background collapse)** 边界条件:低动态失败的轨迹可能因静态未来易于预测而呈现虚假一致性 - 提出**无需价值函数或奖励建模** 的测试时选择方法,仅依赖未来预测间的共识来提升rollout成功率
🏆 总体贡献
- 建立了**动作-状态一致性** 作为WAM可靠性诊断工具和实用规划信号的双重角色 - 在**RoboCasa** 和**RoboTwin 2.0** 任务上,提出的无价值共识策略显著提升了成功率 - 为世界动作模型的可靠性评估提供了新范式,推动了**价值无关(value-free)** 的规划方法发展