← 返回论文列表

多模态车辆轨迹预测的自发现意图感知Transformer模型
Self-Discovered Intention-aware Transformer for Multi-modal Vehicle Trajectory Prediction

作者: Diyi Liu, Zihan Niu, Tu Xu 等4人
arXiv: 2604.07126v1
分类: cs.RO, cs.AI, cs.LG
📝 论文摘要
预测车辆轨迹在自动驾驶和智能交通系统应用中扮演着重要角色。尽管已有多种深度学习算法被设计用于预测车辆轨迹,但它们对特定图结构(如图神经网络)或显式意图标签的依赖限制了其灵活性。本研究提出了一种基于纯Transformer架构的多模态网络,该网络充分考虑了邻近车辆的影响。模型采用双轨设计:一条轨道专注于预测车辆轨迹,另一条轨道则结合邻近车辆信息评估各类驾驶意图的可能性。研究发现,这种双轨设计通过将空间模块与轨迹生成模块分离,有效提升了整体性能。此外,模型还通过预测K条轨迹间的残差偏移量,能够学习到有序的轨迹组。

📊 核心分析

🎯 研究动机
该论文旨在解决多模态车辆轨迹预测中的两个关键限制: - 现有方法过度依赖特定的图结构(如图神经网络(Graph Neural Network)),灵活性不足 - 现有方法需要显式的意图标签,增加了数据标注成本并限制了模型泛化能力
🔧 核心方法
论文提出了一种纯基于Transformer的神经网络架构: - 采用双轨(two-track)设计:一条轨迹预测轨专注于生成轨迹,另一条意图感知轨专注于预测考虑邻车影响的各意图可能性 - 通过预测K条轨迹之间的残差偏移(residual offsets)来学习有序的轨迹组 - 模型整合了多模态(multi-modal)输入并考虑邻车交互
💡 核心创新
论文的核心创新点包括: - 提出首个纯Transformer架构的意图感知轨迹预测模型,摆脱了对图神经网络(Graph Neural Network)结构的依赖 - 创新的双轨设计实现了空间模块与轨迹生成模块的分离,通过自发现(self-discovered)机制学习意图而不依赖显式标签 - 通过残差偏移预测实现了有序多模态轨迹生成,提升了预测的多样性和物理合理性
🏆 总体贡献
论文对该领域的整体贡献为: - 为车辆轨迹预测提供了更灵活、不依赖特定图结构的Transformer基准架构 - 证明了意图学习可以不依赖人工标注,通过模型自发现实现 - 通过模块分离和残差预测机制,在保持预测多样性的同时提升了预测精度