该论文旨在解决在系统动力学和环境结构未知的情况下,如何规划满足信号时序逻辑(Signal Temporal Logic, STL)规范的机器人轨迹这一难题。现有方法通常需要显式模型或学习特定任务的行为,限制了其对新STL任务的零样本(zero-shot)泛化能力。研究背景是仅使用与任务无关的轨迹数据进行离线STL规划。
论文提出了一个名为DAG-STL的分层框架,将长时域STL规划分解为三个阶段:
- **分解(Decomposition)**: 将STL公式分解为具有共享时序约束的**可达性(reachability)**和**不变性(invariance)**进度条件。
- **分配(Allocation)**: 使用学习到的可达时间估计来分配带时间戳的路径点(waypoints)。
- **生成(Generation)**: 使用**基于扩散的生成器(diffusion-based generator)**在这些路径点之间合成轨迹。
此外,框架还引入了:
- **无需滚动的动态一致性度量(rollout-free dynamic consistency metric)**。
- **用于在有限预算下改进多个分配假设的随时细化搜索过程(anytime refinement search procedure)**。
- **用于执行时恢复的分层在线重规划机制(hierarchical online replanning mechanism)**。
论文的核心创新点在于其将逻辑推理与轨迹实现分离的层次化设计哲学,具体体现在:
- **新颖的三阶段分解-分配-生成流水线**: 将全局的、复杂的STL规划问题转化为一系列更短、更易支持的子问题,这是与直接进行端到端规划方法的关键区别。
- **零样本泛化能力**: 框架仅依赖与任务无关的轨迹数据,无需针对每个新STL任务进行重新训练,实现了对未见STL任务的零样本规划。
- **连接规划正确性与执行可行性的桥梁**: 通过引入动态一致性度量和在线重规划机制,弥合了规划层面的逻辑正确性与执行层面的动力学可行性之间的差距。
- **与现有方法的对比**: 不同于依赖显式模型的方法或学习任务特定策略的方法,DAG-STL通过层次化抽象和基于扩散的生成,在未知动力学下实现了更强的泛化性和计算效率。
论文对该领域的整体贡献包括:
- **提出了DAG-STL框架**: 为在未知动力学下进行零样本STL轨迹规划提供了一个系统性的分层解决方案。
- **验证了方法的有效性与泛化性**: 在Maze2D、OGBench AntMaze和Cube等多个领域(导航和操作)的实验中,DAG-STL在复杂长时域STL任务上显著优于直接的**鲁棒性引导扩散(robustness-guided diffusion)**方法。
- **展示了计算优势与恢复能力**: 在具有基于优化的参考环境的自定义实验中,DAG-STL恢复了大部分模型可解的任务,同时相比基于显式系统模型的直接优化方法保持了明显的计算优势。
- **推动了STL规划的实际应用**: 通过解决模型未知和零样本泛化的挑战,使得STL规范能更实际地应用于更广泛的机器人任务中。