- 现有V2X基准存在**开环评估(open-loop evaluation)** 的不足,无法捕捉驾驶的**闭环特性(closed-loop nature)**
- 当前闭环评估缺乏**行为与交互多样性(behavioral and interactive diversity)**,难以反映真实驾驶场景
- 尚不清楚**多智能体系统(multi-agent systems)** 在闭环驾驶中的实际收益程度
- 构建**MDrive基准(MDrive benchmark)**,包含225个场景,基于**NHTSA预碰撞分类法(NHTSA pre-crash typologies)** 和真实V2X数据集
- 提供**开源工具箱(open-source toolbox)**,包括**场景生成(scenario generation)**、**真实到仿真转换(Real2Sim conversion)** 和**人在环路仿真(human-in-the-loop simulation)**
- 采用**闭环评估(closed-loop evaluation)** 框架,对比单智能体与多智能体系统的规划性能
- **首次填补闭环协同驾驶基准空白**:系统性地在闭环条件下评估多智能体V2X系统,解决开环评估与真实驾驶的差异
- **揭示关键矛盾**:发现**感知共享(perception sharing)** 增强感知但不一定改善规划;**协商(negotiation)** 在复杂密集场景中反而损害规划性能
- **场景多样性**:结合官方安全分类与真实数据,覆盖225个场景,增强评估的**行为与交互多样性**
- 为**协同驾驶系统(cooperative driving systems)** 提供**可复现的评估基础(reproducible foundation)**
- 明确多智能体系统在闭环驾驶中的优势与当前挑战,指导未来研究方向
- 开源工具箱促进**场景生成** 和**人在环路仿真**,推动领域标准化与复现