该论文旨在解决多模态车辆轨迹预测中的两个关键限制:
- 现有方法过度依赖特定的图结构(如图神经网络(Graph Neural Network)),灵活性不足
- 现有方法需要显式的意图标签,增加了数据标注成本并限制了模型泛化能力
论文提出了一种纯基于Transformer的神经网络架构:
- 采用双轨(two-track)设计:一条轨迹预测轨专注于生成轨迹,另一条意图感知轨专注于预测考虑邻车影响的各意图可能性
- 通过预测K条轨迹之间的残差偏移(residual offsets)来学习有序的轨迹组
- 模型整合了多模态(multi-modal)输入并考虑邻车交互
论文的核心创新点包括:
- 提出首个纯Transformer架构的意图感知轨迹预测模型,摆脱了对图神经网络(Graph Neural Network)结构的依赖
- 创新的双轨设计实现了空间模块与轨迹生成模块的分离,通过自发现(self-discovered)机制学习意图而不依赖显式标签
- 通过残差偏移预测实现了有序多模态轨迹生成,提升了预测的多样性和物理合理性
论文对该领域的整体贡献为:
- 为车辆轨迹预测提供了更灵活、不依赖特定图结构的Transformer基准架构
- 证明了意图学习可以不依赖人工标注,通过模型自发现实现
- 通过模块分离和残差预测机制,在保持预测多样性的同时提升了预测精度