CLEAR：端到端自动驾驶中自适应路由的认知与潜在评估

📝 论文摘要

端到端自动驾驶模型往往难以在多模态机动生成与实时推理约束之间取得平衡。尽管扩散模型成功捕获了多样化的驾驶行为，但其迭代去噪过程在安全关键部署中会导致不可接受的延迟。为此，我们提出CLEAR（认知与潜在评估自适应路由）框架，该框架将超快生成规划与深度语义推理相结合。CLEAR采用Drive-JEPA作为视觉编码器，并在VAE潜在空间中以单步条件漂移替代多步去噪链，引入条件系数以平衡多样性与专家精度。同时，我们在驾驶问答对上对Qwen~3.5~0.8B进行全参数微调，以提取场景感知的隐藏状态。这些状态同时指导自适应调度器（从预定义的离散方案集合中选择条件系数$α$和样本数量$N$）和交叉注意力评分器（从候选轨迹中选取最优轨迹）。在NAVSIM v1基准上，CLEAR取得了93.7的最优PDMS。我们的结果表明，无需密集几何标注或迭代采样，即可高效执行高保真多模态规划。

🎯 研究动机

- 端到端自动驾驶模型通常难以平衡**多模态机动生成(multi-modal maneuver generation)** 与实时推理约束 - **扩散模型(diffusion models)** 虽能捕捉多样化驾驶行为，但其迭代去噪过程导致延迟过高，不适用于安全关键部署 - 现有方法在生成多样性与专家精度之间缺乏有效权衡，且依赖密集几何标注或迭代采样

🔧 核心方法

- 提出**CLEAR框架**，包含**Drive-JEPA** 作为视觉编码器，取代多步去噪链为**VAE潜空间中的单步条件漂移(single-step conditional drift)**，引入条件系数α来平衡多样性与专家精度 - 微调**Qwen 3.5 0.8B** 模型在驾驶QA对上进行微调，提取场景感知的隐藏状态 - 使用隐藏状态驱动**自适应调度器(Adaptive Scheduler)** 从预定义方案中选择条件系数α和样本数量N，以及**交叉注意力评分器(cross-attention scorer)** 从候选轨迹中选择最优轨迹

💡 核心创新

- **首创性**：将**VAE潜空间单步漂移** 替代扩散模型的迭代去噪，实现超快速生成规划，同时保持多样性 - **语义推理融合**：通过微调大语言模型提取场景感知隐藏状态，用于自适应调度和轨迹评分，实现深度语义推理 - **无需密集几何标注或迭代采样**：通过条件系数和自适应调度平衡多样性与精度，在NAVSIM v1基准上达到SOTA PDMS 93.7

🏆 总体贡献

- 为端到端自动驾驶提供了一种高效、高保真的多模态规划范式，无需迭代采样即可实现实时推理 - 在**NAVSIM v1** 基准上取得**SOTA (state-of-the-art) PDMS 93.7**，验证了方法的有效性 - 表明高阶语义推理与快速生成规划可有机结合，为安全关键场景下的自动驾驶模型设计提供新思路

CLEAR：端到端自动驾驶中自适应路由的认知与潜在评估
CLEAR: Cognition and Latent Evaluation for Adaptive Routing in End-to-End Autonomous Driving

📊 核心分析

CLEAR：端到端自动驾驶中自适应路由的认知与潜在评估 CLEAR: Cognition and Latent Evaluation for Adaptive Routing in End-to-End Autonomous Driving

📊 核心分析

CLEAR：端到端自动驾驶中自适应路由的认知与潜在评估
CLEAR: Cognition and Latent Evaluation for Adaptive Routing in End-to-End Autonomous Driving