该论文旨在解决端到端扩散规划(diffusion planning)在自动驾驶中生成的轨迹物理可行性不足的问题。研究背景是:现有方法生成的轨迹可能存在局部几何不规则、违反轨迹级运动学约束或偏离可行驶区域的问题,表明常用的以噪声为中心的扩散规划公式与自然表征可行性的轨迹空间(trajectory space)尚未很好对齐。
论文提出了FeaXDrive方法,这是一种可行性感知的、以轨迹为中心的扩散规划方法。具体技术包括:
- 采用以干净轨迹(clean trajectory)为统一对象的轨迹中心化公式(trajectory-centric formulation)。
- 在扩散过程中整合自适应曲率约束训练(adaptive curvature-constrained training)以改善内在几何和运动学可行性。
- 在反向扩散采样(reverse diffusion sampling)中引入可行驶区域引导(drivable-area guidance)以增强与可行驶区域的一致性。
- 采用可行性感知的GRPO后训练(feasibility-aware GRPO post-training)来进一步提升规划性能,同时平衡轨迹空间可行性。
论文的核心创新在于将扩散规划的重心从传统的噪声建模转向轨迹空间的可行性建模。独特之处体现在:
- 提出了轨迹中心化的扩散规划公式,将干净的规划轨迹作为扩散过程的统一建模对象,而非仅关注噪声分布。
- 系统性地在训练、采样和后训练三个阶段整合了多种轨迹空间可行性约束(几何、运动学、可行驶区域),实现了端到端的可行性感知规划。
- 通过可行性感知的GRPO后训练,在强化规划性能的同时显式地优化了轨迹空间的可行性指标,实现了性能与物理可行性的更好平衡。
论文的整体贡献包括:
- 提出了FeaXDrive方法,在NAVSIM基准测试上实现了强大的闭环规划性能,并显著提升了轨迹空间可行性。
- 研究结果强调了在端到端扩散规划中显式建模轨迹空间可行性的重要性。
- 为开发更可靠、更具物理基础的自动驾驶规划器(planner)提供了重要的一步。