扩散引导的可泛化城市场景重建增强器

📝 论文摘要

从真实观测中重建城市场景已成为自动驾驶开发和测试的强大工具。尽管当前的神经渲染方法能在记录轨迹上实现高保真渲染，但在大幅视角偏移下其质量显著下降，限制了闭环仿真的适用性。近期研究展示了利用扩散模型提升这些挑战性视角下的质量，并将改进结果蒸馏回三维表征中的潜力。然而，这些方法通常需要昂贵的逐场景优化，且蒸馏后的表征仍然脆弱，无法泛化到有限合成视角之外。为解决这些局限性，我们提出GenRe——一种用于城市场景重建的新型扩散引导通用增强器。GenRe以任意预训练的三维高斯表征为输入，在数分钟内修复其缺陷。通过学习跨多样场景的生成先验蒸馏，GenRe高效生成鲁棒且高保真的表征，可靠泛化到具有挑战性的未见视角（如车道变更）。实验表明，GenRe在质量和效率上均优于现有方法，并有益于多种下游任务，为自动驾驶实现鲁棒且可扩展的传感器仿真。

🎯 研究动机

- 城市场景重建在自动驾驶开发中至关重要，但现有神经渲染方法在大视角偏移时质量显著下降，限制了其在闭环仿真中的应用 - 现有扩散模型增强方法需要昂贵的逐场景优化，且蒸馏后的表示无法泛化到有限的合成视角之外 - 研究背景：从真实观测进行城市场景重建需要高保真度和对未见视角的鲁棒性，以支持可扩展的传感器仿真

🔧 核心方法

- 提出**GenRe**，一个**扩散引导的通用增强器(diffusion-guided generalizable enhancer)**，输入任何预训练的**3D高斯表示(3D Gaussian representation)** 并修复其缺陷 - 通过**跨场景学习(cross-scene learning)** 蒸馏**生成先验(generative priors)**，在数分钟内产生鲁棒且高保真的表示 - 输出增强后的3D高斯表示，能够可靠地泛化到具有挑战性的未见视角（如车道变更）

💡 核心创新

- **跨场景泛化**：首次实现无需逐场景优化的扩散引导增强，在多样场景上学习通用先验，避免了每场景独立训练的成本 - **高效优化**：只需几分钟即可修复预训练表示的缺陷，相比现有方法显著提升效率 - **鲁棒性**：生成的表示不仅对训练视角高保真，还能可靠泛化到大幅视角偏移，如车道变更等未见场景

🏆 总体贡献

- 为城市场景重建提供了一种高效且泛化性强的增强范式，解决了现有方法在视角偏移和泛化方面的瓶颈 - 在质量和效率上均超越现有方法（包括逐场景优化方法），实验验证了在多种下游任务中的有效性 - 支持鲁棒且可扩展的自动驾驶传感器仿真，推动闭环仿真和自动驾驶测试的发展

扩散引导的可泛化城市场景重建增强器
Diffusion-guided Generalizable Enhancer for Urban Scene Reconstruction

📊 核心分析

扩散引导的可泛化城市场景重建增强器 Diffusion-guided Generalizable Enhancer for Urban Scene Reconstruction

📊 核心分析

扩散引导的可泛化城市场景重建增强器
Diffusion-guided Generalizable Enhancer for Urban Scene Reconstruction