- 传统控制方法在动态和不确定环境中性能严重下降
- 数据驱动方法虽然适应性强,但面临高样本复杂度和缺乏严格稳定性保证的局限性
- 需要一种既能保证闭环稳定又能高效学习的数据驱动控制方法,以提升机器人轨迹跟踪的鲁棒性
- 提出**L-Learning** 框架,将**Lyapunov稳定性理论(Lyapunov stability theory)** 与**拉格朗日力学(Lagrangian mechanics)** 相结合
- 从数据中显式学习系统的**能量函数(energy function)**,利用拉格朗日力学结构刻画系统动力学
- 基于学习到的能量函数设计控制器,在优化轨迹跟踪性能的同时保证闭环稳定性
- **首次将拉格朗日力学引入数据驱动控制**,通过学习能量函数内在保证系统稳定性,避免传统数据驱动方法的稳定性缺陷
- **样本效率高**:利用能量函数的物理先验,显著降低对训练数据量的需求
- **提供严格的理论稳定性保证**:基于Lyapunov稳定性理论,在数据驱动框架下实现可证明的闭环稳定控制
- 为机器人轨迹跟踪任务提供了一种融合物理先验的数据驱动控制新范式
- 有效解决了数据驱动方法中样本复杂度与稳定性保证难以兼得的关键难题
- 在控制精度、样本效率和理论保障方面取得综合优势,具有广阔的实际机器人应用前景