多模态轨迹生成(multi-modal trajectory generation)对于安全自动驾驶至关重要,但现有的基于扩散(diffusion)的规划器由于迭代神经函数评估导致高推理延迟,需要一种高吞吐量的单步推理方法。
提出MISTY框架,集成矢量化的子图编码器(Sub-Graph encoder)捕捉环境上下文、变分自编码器(Variational Autoencoder, VAE)将专家轨迹压缩为32维潜空间(latent manifold)、超轻量级MLP-Mixer解码器消除二次注意力复杂度,并引入潜空间漂移损失(latent-space drifting loss)通过显式吸引力和排斥力将分布演化转移到训练阶段。
核心创新在于潜空间漂移损失(latent-space drifting loss),通过显式吸引力和排斥力机制在训练阶段模拟复杂分布演化,使模型能够合成主动超车等新颖、主动的机动动作,这些动作在原始专家演示中几乎不存在,同时实现纯单步推理。
在nuPlan基准测试的Test14-hard子集上取得非反应式和反应式设置下80.32和82.21的综合分数,以超过99 FPS和10.1 ms端到端延迟运行,比迭代扩散规划器快一个数量级,同时保持鲁棒的生成性能。