使用流匹配学习自动驾驶的直接控制策略

📝 论文摘要

我们提出了一种用于自动驾驶的流匹配规划器，能够直接输出由加速度和曲率曲线定义的可执行控制轨迹。该模型以周围场景的鸟瞰图栅格为条件，在少量常微分方程积分步骤中生成控制序列，实现了适用于实时闭环重新规划的低延迟推理。我们仅在从包含反应式智能体的二维交通模拟器收集的城市场景（意大利帕尔马市的真实城市街道、交叉路口和环岛）上进行训练，并在分布内和明显分布外的环境中进行闭环评估，包括多车道高速公路和未见过的城市场景。结果表明，该模型能够可靠地泛化到这些未见条件，保持稳定的闭环控制，并成功完成与训练分布有显著差异的场景。我们将此归因于鸟瞰图表示（提供以几何为中心的视图，本质上对分布变化不敏感）以及流匹配公式（学习平滑向量场，在分布变化下表现优雅退化）。我们提供了闭环行为的视频演示，网址为https://marcelloceresini.github.io/DirectControlFlowMatching。

🎯 研究动机

- 现有**自动驾驶自动驾驶(autonomous driving)** 方法在实时闭环重规划和分布外场景泛化方面存在挑战 - 传统路径规划方法依赖多阶段模块，延迟高且容易积累误差 - 需要一种直接输出可执行控制轨迹（加速度和曲率）的低延迟策略，能够适应未见过环境

🔧 核心方法

- 提出基于**流匹配(flow matching)** 的规划器，直接生成加速度和曲率轮廓构成的**控制轨迹(control trajectories)** - 模型以**鸟瞰图(Bird's-Eye-View, BEV)** 栅格为条件，通过少量**常微分方程(ODE)** 积分步骤生成控制序列 - 训练数据来自2D交通模拟器中的城市场景（街道、交叉口、环岛），包含反应性智能体

💡 核心创新

- **直接控制输出**：首次将**流匹配(flow matching)** 用于自动驾驶直接控制策略，跳过中间路径表示 - **泛化性设计**：**BEV表示** 提供几何中心视图，对分布偏移不敏感；**流匹配** 学习光滑向量场，在分布外场景下优雅降级 - **低延迟推理**：仅需少量ODE步数即可生成轨迹，满足实时闭环重规划要求 - **跨分布泛化**：仅在2D模拟器城市场景训练，但能泛化到真实多车道高速公路和未见城市场景

🏆 总体贡献

- 为自动驾驶**直接控制策略(direct control policies)** 提供了一种新颖的**流匹配(flow matching)** 范式 - 在分布内和分布外环境中均展现了稳定的闭环控制性能，证明了方法的鲁棒性 - 通过低延迟推理和泛化能力，推动了自动驾驶系统在真实场景中的实用化进展 - 提供了视频演示和开源资源，促进社区复现与后续研究

使用流匹配学习自动驾驶的直接控制策略
Learning Direct Control Policies with Flow Matching for Autonomous Driving

📊 核心分析

使用流匹配学习自动驾驶的直接控制策略 Learning Direct Control Policies with Flow Matching for Autonomous Driving

📊 核心分析

使用流匹配学习自动驾驶的直接控制策略
Learning Direct Control Policies with Flow Matching for Autonomous Driving