MDrive：面向端到端多智能体系统的闭环协同驾驶基准测试

📝 论文摘要

车联网（V2X）通信已成为自动驾驶领域极具前景的范式，使得联网智能体能够共享互补感知信息并相互协商，从而优化最终规划。然而，现有V2X基准测试存在两方面不足：(i) 开环评估未能捕捉驾驶本质上闭环的特性，导致评估偏差；(ii) 当前闭环评估缺乏反映真实驾驶场景的行为与交互多样性。因此，多智能体系统对闭环驾驶的收益程度尚不明确。本文提出MDrive——一个包含225个场景的闭环协同驾驶基准测试，这些场景基于美国国家公路交通安全管理局（NHTSA）碰撞前情景分类及真实世界V2X数据集构建。基准测试结果表明，多智能体系统普遍优于单智能体系统。然而，当前多智能体系统仍面临两大挑战：(i) 感知共享虽增强感知能力，却未必总能转化为更好的规划；(ii) 协商虽提升规划性能，但在复杂密集交通场景中反而产生负面影响。MDrive进一步提供开源工具箱，支持场景生成、真实到仿真（Real2Sim）转换及人在环仿真。综上，MDrive为评估与提升协同驾驶系统的泛化性和鲁棒性奠定了可复现的基础。

🎯 研究动机

- 现有V2X基准存在**开环评估(open-loop evaluation)** 的不足，无法捕捉驾驶的**闭环特性(closed-loop nature)** - 当前闭环评估缺乏**行为与交互多样性(behavioral and interactive diversity)**，难以反映真实驾驶场景 - 尚不清楚**多智能体系统(multi-agent systems)** 在闭环驾驶中的实际收益程度

🔧 核心方法

- 构建**MDrive基准(MDrive benchmark)**，包含225个场景，基于**NHTSA预碰撞分类法(NHTSA pre-crash typologies)** 和真实V2X数据集 - 提供**开源工具箱(open-source toolbox)**，包括**场景生成(scenario generation)**、**真实到仿真转换(Real2Sim conversion)** 和**人在环路仿真(human-in-the-loop simulation)** - 采用**闭环评估(closed-loop evaluation)** 框架，对比单智能体与多智能体系统的规划性能

💡 核心创新

- **首次填补闭环协同驾驶基准空白**：系统性地在闭环条件下评估多智能体V2X系统，解决开环评估与真实驾驶的差异 - **揭示关键矛盾**：发现**感知共享(perception sharing)** 增强感知但不一定改善规划；**协商(negotiation)** 在复杂密集场景中反而损害规划性能 - **场景多样性**：结合官方安全分类与真实数据，覆盖225个场景，增强评估的**行为与交互多样性**

🏆 总体贡献

- 为**协同驾驶系统(cooperative driving systems)** 提供**可复现的评估基础(reproducible foundation)** - 明确多智能体系统在闭环驾驶中的优势与当前挑战，指导未来研究方向 - 开源工具箱促进**场景生成** 和**人在环路仿真**，推动领域标准化与复现

MDrive：面向端到端多智能体系统的闭环协同驾驶基准测试
MDrive: Benchmarking Closed-Loop Cooperative Driving for End-to-End Multi-agent Systems

📊 核心分析

MDrive：面向端到端多智能体系统的闭环协同驾驶基准测试 MDrive: Benchmarking Closed-Loop Cooperative Driving for End-to-End Multi-agent Systems

📊 核心分析

MDrive：面向端到端多智能体系统的闭环协同驾驶基准测试
MDrive: Benchmarking Closed-Loop Cooperative Driving for End-to-End Multi-agent Systems