研究动机: 解决无信号灯交叉路口自动驾驶中的多车交互难题,需要平衡安全性与通行效率。现有方法存在局限性:
- 模型预测控制(MPC)依赖人工规则,通常导致过于保守的驾驶行为
- 深度强化学习(RL)能从经验中学习自适应行为,但难以保证安全性且泛化能力不足
核心方法: 提出集成MPC-RL框架:
- 耦合模型预测控制(Model Predictive Control, MPC)与深度强化学习(Deep Reinforcement Learning, RL)
- MPC提供结构化约束处理和安全基础
- RL学习自适应策略以提升效率
- 在三种交通密度水平下进行实验验证
核心创新点: 提出创新的混合控制架构:
- 首次将MPC的优化框架与RL的适应性学习能力深度耦合
- MPC作为安全骨干网络,RL作为效率优化器,实现安全与效率的动态平衡
- 框架支持零样本迁移(zero-shot transfer)到新场景(如高速公路汇入)
- 相比纯MPC减少21%碰撞率,提升6.5%成功率
- 训练过程中损失函数更快稳定,表明学习负担显著降低
总体贡献:
- 提出可解释的混合控制框架,在安全约束下提升驾驶效率
- 通过实验证明MPC-RL在交叉路口场景中优于独立MPC和端到端RL
- 验证MPC骨干网络对跨场景鲁棒性的关键作用
- 提供开源实现代码,促进相关研究发展
- 为多智能体自动驾驶场景提供了新的安全与效率平衡方案