通过相位变化神经势函数的反应性运动生成

📝 论文摘要

基于演示学习的动态系统方法能够从少量演示中提供稳定且连续的策略。一阶动态系统在状态唯一速度定义的条件下，对点对点和周期性任务非常有效。对于存在交叉点（例如绘制"8"字形）的任务，通常需要引入二阶动力学或相位变量等扩展。然而，通过引入速度变量，二阶模型会因其利用速度区分运动方向而对交叉点附近的扰动变得敏感。此外，当几乎相同的位置-速度对对应不同后续运动时，这种区分方式可能失效。相比之下，基于相位的方法依赖开环时间或相位变量，这限制了其在扰动后的恢复能力。我们提出相位变化神经势函数这一基于演示学习框架，该框架将势函数与通过状态进度直接估计的相位变量（而非开环时间输入）相关联。该相位变量使系统能够处理状态重访，而学习得到的势函数可生成用于反应式稳定控制的局部向量场。相位变化神经势函数能有效泛化于点对点、周期性及完整六维运动任务，在含交叉点的轨迹上优于现有基线方法，并在外部扰动下的实时机器人操作中展现出稳健性能。

🎯 研究动机

- 现有**动态系统(dynamical systems, DS)** 方法在处理具有轨迹交叉（如画“8”）的任务时存在困难 - 二阶DS模型对交叉附近的扰动敏感，且当相同位置-速度对对应不同运动方向时，速度区分可能失效 - 基于相位变量的方法依赖开环时间或相位变量，导致受扰动后无法恢复，缺乏反应能力

🔧 核心方法

- 提出**相位变化神经势函数(Phase-varying Neural Potential Functions, PNPF)** 框架 - 将势函数(potential function)条件化在一个**相位变量(phase variable)** 上，该相位变量直接从状态进展(state progression)估计，而非开环时间输入 - 学习得到的势函数生成**局部向量场(local vector fields)**，用于反应式(reactive)和稳定(stable)控制

💡 核心创新

- **相位变量自适应估计**：提出从状态进展直接估计相位变量，替代传统的开环时间或速度，使系统能处理状态重访(state revisits)且具备扰动恢复能力 - **统一框架**：PNPF能泛化到点到点、周期、全6D运动任务，尤其在交叉轨迹上表现优越，而现有方法难以同时处理多种任务类型 - **鲁棒反应控制**：通过局部向量场实现实时机器人操作中的外部扰动鲁棒性，结合了稳定性与反应性

🏆 总体贡献

- 为**学习示范(Learning-from-Demonstration, LfD)** 领域提供了一种新颖的基于相位势函数的反应式运动生成范式 - 在具有轨迹交叉的任务上显著优于现有基线方法，证明了在复杂运动模式下的有效性 - 实现了鲁棒的实时机器人操作，在外部干扰下仍能保持稳定控制，推动了DS方法在真实机器人中的应用

通过相位变化神经势函数的反应性运动生成
Reactive Motion Generation via Phase-varying Neural Potential Functions

📊 核心分析

通过相位变化神经势函数的反应性运动生成 Reactive Motion Generation via Phase-varying Neural Potential Functions

📊 核心分析

通过相位变化神经势函数的反应性运动生成
Reactive Motion Generation via Phase-varying Neural Potential Functions