- 现有**模仿学习(imitation learning)** 方法仅从成功驾驶演示中学习,最小化几何偏差,隐含假设空间接近即安全,导致目标不匹配:相同模仿损失的轨迹可能有截然不同的安全结果(可恢复 vs 碰撞)
- 现有方法无法显式建模**安全不对称性(safety asymmetry)**,即靠近专家轨迹不代表安全,缺乏对失败驾驶行为的利用
- 研究背景:端到端自动驾驶需要同时学习成功与失败行为,以建立安全边界
- 提出**BeyondDrive** 框架,包含三个核心组件
- 基于**流匹配(flow matching)** 的**负轨迹生成器(negative trajectory generator)**,合成安全关键但接近专家轨迹的硬负样本,显式建模安全不对称性
- **多样性感知采样策略(diversity-aware sampling strategy)**,缓解模式坍塌并覆盖多样化的失败模式
- **排斥距离损失(Repulsive Distance Loss)**,同时吸引预测向专家演示靠近,并排斥远离硬负轨迹,在轨迹空间中建立判别性安全边界
- **首次将失败驾驶行为纳入端到端模仿学习**,通过显式生成并学习硬负样本打破仅从成功演示学习的局限
- **流匹配生成硬负轨迹**:不同于随机扰动或对抗攻击,流匹配生成与专家轨迹近邻但安全性差的轨迹,精确建模安全不对称性
- **排斥距离损失**:在轨迹空间同时施加吸引力和排斥力,建立明确的**安全边界(safety boundary)**,不同于传统仅最小化误差的损失
- **通用架构**:可应用于不同自动驾驶框架(单模态、多模态规划器),并展现强零样本迁移能力
- 提出**失败感知模仿学习(failure-aware imitation learning)** 新范式,解决模仿学习中安全不对称性问题
- 在**NAVSIMv1闭环基准** 上达到**89.7 PDMS**,超越先前SOTA方法
- 在**HUGSIM基准** 上展现强零样本迁移能力,证明泛化性
- 开源代码和框架,促进端到端自动驾驶安全研究