该论文旨在解决自动驾驶系统在恶劣能见度条件下(如雨、夜、雪)性能下降的问题。研究背景是:在这些条件下,在线场景几何信息(如车道线、道路边界、人行横道)变得稀疏或破碎,而高精地图(HD maps)虽能提供缺失的结构信息,但大规模构建和维护成本高昂。
论文提出了一个名为 定位引导的前景增强(Localization-Guided Foreground Augmentation, LG-FA) 的轻量级即插即用推理模块。其核心方法具体包括三个步骤:
- 从每帧的 鸟瞰图(Bird's-Eye View, BEV) 预测中增量式构建一个稀疏的全局矢量层。
- 通过 类别约束的几何对齐(class-constrained geometric alignment) 来估计自车姿态,联合优化定位并补全缺失的局部拓扑结构。
- 将增强后的前景信息重投影到一个统一的全局坐标系中,以改进每帧的预测。
论文的核心创新点在于:
- **提出了一种不依赖高精地图的在线几何上下文增强方法**:与依赖昂贵、静态高精地图的传统方案不同,LG-FA 通过在线融合多帧BEV感知结果,动态构建并利用一个稀疏的全局矢量层作为几何先验,成本更低且能适应环境变化。
- **实现了定位与感知的协同优化**:通过“类别约束的几何对齐”将前景物体(如车道线)的几何信息用于辅助自车定位,同时利用改进的定位结果来对齐和补全多帧感知数据,形成“感知提升定位,定位优化感知”的闭环。
- **设计了一个轻量级、即插即用的模块**:该模块无需修改现有的BEV感知主干网络,可以无缝集成到现有系统中,以较低的计算开销提升几何完整性和时间一致性。
论文对该领域的总体贡献是:
- **方法论贡献**:提出了一种新颖的LG-FA框架,为自动驾驶感知提供了不依赖高精地图的、可靠的在线几何上下文先验。
- **性能提升**:在nuScenes数据集上的实验表明,该方法能有效提升BEV表示的几何完整性与时间稳定性,降低定位误差,并生成全局一致的车道和拓扑重建。
- **系统实用性**:该模块易于集成,能为下游任务(如跟踪和决策)提供稳定的结构支持,增强了整个自动驾驶系统在挑战性场景下的鲁棒性。