- 针对**长时域稀疏奖励任务(long-horizon sparse reward tasks)** 的规划问题,当前生成模型虽取得进展,但缺乏**层次化分解(hierarchical decomposition)** 的原则性框架
- 现有方法依赖**迭代去噪(iterative denoising)** 过程,导致**实时执行(real-time execution)** 的计算负担过重
- 研究背景:扩散模型和整流流模型各自在规划中展现出优势,但单一范式存在局限性(扩散慢但探索强,整流快但探索弱)
- 提出**层次扩散-流规划框架(HDFlow)**,包含高层和低层两个生成模型
- 高层:**扩散规划器(diffusion planner)** 在**学习潜在空间(learned latent space)** 中生成**战略性子目标(strategic subgoals)** 序列,利用扩散的**强探索能力(exploratory capability)**
- 低层:**整流流规划器(rectified flow planner)** 基于子目标,通过**常微分方程(ODE)** 生成平滑密集轨迹,利用ODE的**快速推理速度(speed and efficiency)**
- 整体框架实现层次化分解,结合扩散的探索和整流流的生成效率
- **首创层次混合生成范式**:首次将**扩散(diffusion)** 与**整流流(rectified flow)** 结合到一个统一的层次规划框架中,互相弥补缺点
- **计算效率提升**:利用整流流的ODE单步求解特性,避免了扩散模型的多步迭代,实现实时规划
- **原则性层次分解**:高层在潜在空间生成子目标(语义抽象),低层生成密集轨迹(连续控制),形成自然的分层,而非简单的宏动作拆分
- **泛化性验证**:不仅在家具组装任务上超越SOTA,还在多种**移动操作(manipulation and locomotion)** 基准上展示跨任务泛化能力
- 为**长时域复杂任务规划** 提供了一种新颖的**层次生成式规划范式**,有效兼顾了探索质量和执行速度
- 在四项**家具组装(furniture assembly)** 任务(仿真与真实)中显著超越现有方法,达到**SOTA性能(state-of-the-art)**
- 开源项目网站和代码,促进后续研究复现和扩展,推动了生成式模型在机器人规划领域的应用