← 返回论文列表

用于真实-合成协同训练的闭环动态驾驶数据混合
Closed Loop Dynamic Driving Data Mixture for Real-Synthetic Co-Training

作者: Hongzhi Ruan, Pei Liu, Weiliang Ma 等8人
arXiv: 2605.21372v1
分类: cs.CV, cs.AI, cs.LG, cs.RO
📝 论文摘要
数据缩放是现代深度学习的基础,随着自动驾驶转向端到端学习,其重要性日益凸显。现实世界的驾驶数据标注成本高昂且存在场景偏差,因此利用近乎无限合成数据进行真实-合成协同训练成为一个有前景的方向。然而,简单地将所有可用合成数据纳入训练既低效又会导致分布偏移,而在实际训练预算下优化数据混合仍然是一个关键但尚未充分探索的问题。基于此,我们认为训练数据的混合需要在场景类型和数量方面得到清晰指导。具体而言,本研究将数据混合概念近似为一个动态优化过程,该过程通过闭环评估反馈迭代调整训练数据混合以最大化模型性能,并提出了AutoScale——一个完全自动化的闭环数据引擎,统一了场景表示、数据混合优化与检索以及模型训练与评估。我们提出了面向驾驶场景表示的图正则化自编码器(Graph-RAE)、用于聚类级重要性估计与权重重分配的聚类感知梯度上升(Cluster-GA),并实施聚类引导的向量检索以选择高价值样本。在NavSim上的实验表明,AutoScale优于原始协同训练和跨域基线方法,在有限预算下使用更少的合成样本实现了更优性能。

📊 核心分析

🎯 研究动机
- 自动驾驶向**端到端学习(end-to-end learning)** 转变,但真实世界驾驶数据昂贵且存在**场景偏差(scene bias)** - **真实-合成协同训练(real-synthetic co-training)** 虽可行,但简单混合所有合成数据效率低下,导致**分布偏移(distribution shift)** - 在有限训练预算下优化数据混合比例是一个**关键但尚未充分探索的问题** - 需要针对**场景类型和数量** 提供清晰指导,动态调整训练数据混合
🔧 核心方法
- 提出**AutoScale** 全自动闭环数据引擎,统一场景表示、数据混合优化与检索、模型训练与评估 - 使用**图正则化自编码器(Graph Regularized AutoEncoder, Graph-RAE)** 对驾驶场景进行表示学习 - 引入**聚类感知梯度上升(Cluster-aware Gradient Ascent, Cluster-GA)** 进行聚类级重要性估计与重新加权 - 执行**聚类引导向量检索(cluster-guided vector retrieval)** 从合成数据中选择高价值样本
💡 核心创新
- **首次** 将数据混合视为**动态优化过程**,通过闭环评估反馈迭代调整训练数据构成 - **Graph-RAE** 利用图结构编码场景关系,优于传统自编码器表示 - **Cluster-GA** 基于梯度信息自适应调整每个聚类的重要性权重,避免人为预设 - 在**有限预算** 下,相比常规协同训练和跨域基线,用更少合成样本获得更好性能
🏆 总体贡献
- 为自动驾驶领域提供了一种**自动化数据混合优化范式**,缓解真实数据稀缺与合成数据分布偏移 - 在**NavSim** 基准上验证了有效性,达到更优性能且节省合成数据开销 - 提出的**闭环数据引擎** 思路可推广至其他依赖于数据混合的**领域适应(domain adaptation)** 任务 - 推动了**真实-合成协同训练** 在端到端自动驾驶中的实用化进程