HDFlow：面向长时域任务的分层扩散流规划

📝 论文摘要

近年来，生成模型在生成长时域、稀疏奖励任务的行为规划方面展现出潜力。尽管这些方法取得了令人鼓舞的成果，但它们往往缺乏一个原则性的分层分解框架，且由于迭代去噪过程，在实时执行中面临计算需求上的挑战。在这项工作中，我们提出分层扩散流（HDFlow），一种新颖的分层规划框架，该框架最优地结合了扩散模型和整流流模型的优势，以克服单一范式生成规划器的局限性。HDFlow采用高级扩散规划器在学习的隐空间中生成战略性子目标序列，充分利用扩散模型强大的探索能力。这些子目标随后引导低级整流流规划器生成平滑且密集的轨迹，利用基于常微分方程（ODE）的轨迹生成的速度和效率。我们在仿真和真实世界中的四个具有挑战性的家具组装任务上评估了HDFlow，其显著优于现有最先进方法。此外，我们还在两个包含不同运动与操作任务的长时域基准测试中展示了我们方法的泛化能力。项目网站：https://hdflow-page.github.io/

🎯 研究动机

- 针对**长时域稀疏奖励任务(long-horizon sparse reward tasks)** 的规划问题，当前生成模型虽取得进展，但缺乏**层次化分解(hierarchical decomposition)** 的原则性框架 - 现有方法依赖**迭代去噪(iterative denoising)** 过程，导致**实时执行(real-time execution)** 的计算负担过重 - 研究背景：扩散模型和整流流模型各自在规划中展现出优势，但单一范式存在局限性（扩散慢但探索强，整流快但探索弱）

🔧 核心方法

- 提出**层次扩散-流规划框架(HDFlow)**，包含高层和低层两个生成模型 - 高层：**扩散规划器(diffusion planner)** 在**学习潜在空间(learned latent space)** 中生成**战略性子目标(strategic subgoals)** 序列，利用扩散的**强探索能力(exploratory capability)** - 低层：**整流流规划器(rectified flow planner)** 基于子目标，通过**常微分方程(ODE)** 生成平滑密集轨迹，利用ODE的**快速推理速度(speed and efficiency)** - 整体框架实现层次化分解，结合扩散的探索和整流流的生成效率

💡 核心创新

- **首创层次混合生成范式**：首次将**扩散(diffusion)** 与**整流流(rectified flow)** 结合到一个统一的层次规划框架中，互相弥补缺点 - **计算效率提升**：利用整流流的ODE单步求解特性，避免了扩散模型的多步迭代，实现实时规划 - **原则性层次分解**：高层在潜在空间生成子目标（语义抽象），低层生成密集轨迹（连续控制），形成自然的分层，而非简单的宏动作拆分 - **泛化性验证**：不仅在家具组装任务上超越SOTA，还在多种**移动操作(manipulation and locomotion)** 基准上展示跨任务泛化能力

🏆 总体贡献

- 为**长时域复杂任务规划** 提供了一种新颖的**层次生成式规划范式**，有效兼顾了探索质量和执行速度 - 在四项**家具组装(furniture assembly)** 任务（仿真与真实）中显著超越现有方法，达到**SOTA性能(state-of-the-art)** - 开源项目网站和代码，促进后续研究复现和扩展，推动了生成式模型在机器人规划领域的应用

HDFlow：面向长时域任务的分层扩散流规划
HDFlow: Hierarchical Diffusion-Flow Planning for Long-horizon Tasks

📊 核心分析

HDFlow：面向长时域任务的分层扩散流规划 HDFlow: Hierarchical Diffusion-Flow Planning for Long-horizon Tasks

📊 核心分析

HDFlow：面向长时域任务的分层扩散流规划
HDFlow: Hierarchical Diffusion-Flow Planning for Long-horizon Tasks