← 返回论文列表

使用流匹配学习自动驾驶的直接控制策略
Learning Direct Control Policies with Flow Matching for Autonomous Driving

作者: Marcello Ceresini, Federico Pirazzoli, Andrea Bertogalli 等8人
arXiv: 2605.14832v1
分类: cs.RO, cs.CV
📝 论文摘要
我们提出了一种用于自动驾驶的流匹配规划器,能够直接输出由加速度和曲率曲线定义的可执行控制轨迹。该模型以周围场景的鸟瞰图栅格为条件,在少量常微分方程积分步骤中生成控制序列,实现了适用于实时闭环重新规划的低延迟推理。我们仅在从包含反应式智能体的二维交通模拟器收集的城市场景(意大利帕尔马市的真实城市街道、交叉路口和环岛)上进行训练,并在分布内和明显分布外的环境中进行闭环评估,包括多车道高速公路和未见过的城市场景。结果表明,该模型能够可靠地泛化到这些未见条件,保持稳定的闭环控制,并成功完成与训练分布有显著差异的场景。我们将此归因于鸟瞰图表示(提供以几何为中心的视图,本质上对分布变化不敏感)以及流匹配公式(学习平滑向量场,在分布变化下表现优雅退化)。我们提供了闭环行为的视频演示,网址为https://marcelloceresini.github.io/DirectControlFlowMatching。

📊 核心分析

🎯 研究动机
- 现有**自动驾驶自动驾驶(autonomous driving)** 方法在实时闭环重规划和分布外场景泛化方面存在挑战 - 传统路径规划方法依赖多阶段模块,延迟高且容易积累误差 - 需要一种直接输出可执行控制轨迹(加速度和曲率)的低延迟策略,能够适应未见过环境
🔧 核心方法
- 提出基于**流匹配(flow matching)** 的规划器,直接生成加速度和曲率轮廓构成的**控制轨迹(control trajectories)** - 模型以**鸟瞰图(Bird's-Eye-View, BEV)** 栅格为条件,通过少量**常微分方程(ODE)** 积分步骤生成控制序列 - 训练数据来自2D交通模拟器中的城市场景(街道、交叉口、环岛),包含反应性智能体
💡 核心创新
- **直接控制输出**:首次将**流匹配(flow matching)** 用于自动驾驶直接控制策略,跳过中间路径表示 - **泛化性设计**:**BEV表示** 提供几何中心视图,对分布偏移不敏感;**流匹配** 学习光滑向量场,在分布外场景下优雅降级 - **低延迟推理**:仅需少量ODE步数即可生成轨迹,满足实时闭环重规划要求 - **跨分布泛化**:仅在2D模拟器城市场景训练,但能泛化到真实多车道高速公路和未见城市场景
🏆 总体贡献
- 为自动驾驶**直接控制策略(direct control policies)** 提供了一种新颖的**流匹配(flow matching)** 范式 - 在分布内和分布外环境中均展现了稳定的闭环控制性能,证明了方法的鲁棒性 - 通过低延迟推理和泛化能力,推动了自动驾驶系统在真实场景中的实用化进展 - 提供了视频演示和开源资源,促进社区复现与后续研究