← 返回论文列表

从提示到路面的时间跨度:自主场景到规划推理中的时间定位
From Prompts to Pavement Through Time: Temporal Grounding in Agentic Scene-to-Plan Reasoning

作者: Ahmed Y. Gado, Omar Y. Goba, Alaa Hassanein 等5人
arXiv: 2605.19824v1
分类: cs.AI, cs.CL, cs.CV, cs.RO
📝 论文摘要
近期,通过组合大语言模型(LLMs)与大多模态模型(LMMs)来支持自动驾驶车辆(AVs)高层场景解读与规划的尝试,仍然将时间视为次要属性。这种时间根基的缺失会导致对连续动作推理的不一致性,从而削弱安全性与可解释性。本研究探讨智能体间通信中的时间条件约束能否在不降低语义或逻辑一致性的前提下,保持或增强连贯性。为此,我们引入三种逐步增强时间集成度的规划器架构,并在BDD-X数据集精选子集上使用语义、句法和逻辑指标进行评估。结果表明,尽管时间条件约束重塑了推理风格,但在基于标准自然语言处理的正确性指标上并未产生统计意义上的显著改进。然而,定性分析揭示了哨兵智能体中的预测性危险推理、稳定纠正行为及策略性分歧。这些发现厘清了基于提示的时间根基的局限性,并为时间序列场景到规划的推理建立了首个实证基准。

📊 核心分析

🎯 研究动机
- 自动驾驶(Autonomous Vehicles, AVs)中,现有利用大语言模型(LLM)和大多模态模型(LMM)组合进行高层场景解释与规划的方法,普遍将时间作为次要属性处理 - 缺乏时间基础(temporal grounding)导致连续动作推理出现不一致性,削弱了安全性和可解释性 - 研究背景:智能体间通信中的时间条件化(temporal conditioning)能否在不损失语义或逻辑一致性的前提下,保持或提升推理连贯性尚不明确
🔧 核心方法
- 提出三种**规划器架构(planner architectures)**,逐步增加时间集成(temporal integration)程度 - 在**BDD-X数据集** 的精选子集上进行评估,使用语义、句法和逻辑指标 - 采用标准NLP正确性指标(如语义、句法、逻辑)进行定量分析,并结合定性分析揭示推理行为
💡 核心创新
- **首次系统性探索**:在智能体间通信中引入**时间条件化(temporal conditioning)**,研究其对场景到规划推理的影响 - **三种渐进式时间集成架构**:通过逐步增强时间依赖,对比分析时间条件化对推理风格和一致性的作用 - **定性发现**:揭示了时间条件化带来的**预测性危险推理(predictive hazard reasoning)**、**稳定纠正行为(stable corrective behavior)** 和**战略分歧(strategic divergence)** (尤其是Sentinel架构),这些是现有方法未观察到的
🏆 总体贡献
- **明确基于提示的时间基础(prompt-based temporal grounding)的局限性**:时间条件化虽重塑推理风格,但未在标准NLP正确性指标上带来统计显著提升 - **建立首个时间场景到规划推理的实证基准(empirical benchmark)**,为后续研究提供定量和定性评估框架 - **为自动驾驶中的安全推理提供新视角**:强调需要超越现有指标,关注时间一致性对安全关键行为的影响