← 返回论文列表

自动驾驶中的定位引导前景增强
Localization-Guided Foreground Augmentation in Autonomous Driving

作者: Jiawei Yong, Deyuan Qu, Qi Chen 等5人
arXiv: 2604.18940v1
分类: cs.CV, cs.RO
📝 论文摘要
自动驾驶系统在恶劣能见度条件下——如雨天、夜间或雪天——性能常会下降,此时在线场景几何信息(如车道分隔线、道路边界和人行横道)会变得稀疏或断裂。虽然高精地图能提供缺失的结构化上下文信息,但其大规模构建和维护成本高昂。我们提出定位引导前景增强模块,这是一种轻量级即插即用的推理模块,通过在线增强几何上下文来提升前景感知能力。该模块具备三大功能:(一)逐帧从鸟瞰图预测中增量构建稀疏全局矢量层;(二)通过类约束几何对齐实现自车姿态估计,同步提升定位精度并补全缺失的局部拓扑结构;(三)将增强后的前景重投影至统一全局坐标系,以优化单帧预测结果。在具有挑战性的nuScenes数据集序列上的实验表明,该模块能显著提升鸟瞰图表征的几何完整性与时序稳定性,降低定位误差,并生成全局一致的车道与拓扑重建结果。该模块无需修改主干网络即可无缝集成到现有基于鸟瞰图的感知系统中。通过提供可靠的几何上下文先验,该模块不仅增强了时序一致性,更为跟踪与决策等下游模块提供了稳定的结构化支持。

📊 核心分析

🎯 研究动机
该论文旨在解决自动驾驶系统在恶劣能见度条件下(如雨、夜、雪)性能下降的问题。研究背景是:在这些条件下,在线场景几何信息(如车道线、道路边界、人行横道)变得稀疏或破碎,而高精地图(HD maps)虽能提供缺失的结构信息,但大规模构建和维护成本高昂。
🔧 核心方法
论文提出了一个名为 定位引导的前景增强(Localization-Guided Foreground Augmentation, LG-FA) 的轻量级即插即用推理模块。其核心方法具体包括三个步骤: - 从每帧的 鸟瞰图(Bird's-Eye View, BEV) 预测中增量式构建一个稀疏的全局矢量层。 - 通过 类别约束的几何对齐(class-constrained geometric alignment) 来估计自车姿态,联合优化定位并补全缺失的局部拓扑结构。 - 将增强后的前景信息重投影到一个统一的全局坐标系中,以改进每帧的预测。
💡 核心创新
论文的核心创新点在于: - **提出了一种不依赖高精地图的在线几何上下文增强方法**:与依赖昂贵、静态高精地图的传统方案不同,LG-FA 通过在线融合多帧BEV感知结果,动态构建并利用一个稀疏的全局矢量层作为几何先验,成本更低且能适应环境变化。 - **实现了定位与感知的协同优化**:通过“类别约束的几何对齐”将前景物体(如车道线)的几何信息用于辅助自车定位,同时利用改进的定位结果来对齐和补全多帧感知数据,形成“感知提升定位,定位优化感知”的闭环。 - **设计了一个轻量级、即插即用的模块**:该模块无需修改现有的BEV感知主干网络,可以无缝集成到现有系统中,以较低的计算开销提升几何完整性和时间一致性。
🏆 总体贡献
论文对该领域的总体贡献是: - **方法论贡献**:提出了一种新颖的LG-FA框架,为自动驾驶感知提供了不依赖高精地图的、可靠的在线几何上下文先验。 - **性能提升**:在nuScenes数据集上的实验表明,该方法能有效提升BEV表示的几何完整性与时间稳定性,降低定位误差,并生成全局一致的车道和拓扑重建。 - **系统实用性**:该模块易于集成,能为下游任务(如跟踪和决策)提供稳定的结构支持,增强了整个自动驾驶系统在挑战性场景下的鲁棒性。