- 现有**世界动作模型(World Action Model, WAM)** 主要通过预测未来观察和动作进行决策,但生成的未来序列的**可靠性** 缺乏系统评估
- 已有的评估侧重**视觉真实性(visual realism)**,忽略了预测动作与状态转换之间的**动态一致性(dynamic consistency)**
- 研究背景:WAM在机器人、游戏等领域应用广泛,但失败轨迹可能因视觉逼真而误判为有效,需要新的诊断维度
- 对代表性**联合预测模型(joint-prediction model)** 和**逆动力学模型(inverse-dynamics model)** 进行系统性实验,测量**动作-状态一致性(action-state consistency)**
- 通过对比成功与失败rollout的consistency值,揭示其与**价值估计(value estimate)** 的相似趋势
- 提出**无价值共识策略(value-free consensus strategy)**,在测试时对多个候选rollout按未来预测的一致性进行排序和选择
- **首次提出** 动作-状态一致性(action-state consistency)作为WAM可靠性的关键指标,超越视觉真实性
- 识别**背景坍缩(background collapse)** 边界条件:低动态失败的轨迹可能因静态未来易于预测而呈现虚假一致性
- 提出**无需价值函数或奖励建模** 的测试时选择方法,仅依赖未来预测间的共识来提升rollout成功率
- 建立了**动作-状态一致性** 作为WAM可靠性诊断工具和实用规划信号的双重角色
- 在**RoboCasa** 和**RoboTwin 2.0** 任务上,提出的无价值共识策略显著提升了成功率
- 为世界动作模型的可靠性评估提供了新范式,推动了**价值无关(value-free)** 的规划方法发展