- 解决**腱驱动连续体机器人(Tendon-Driven Continuum Robots, TDCRs) ** 的精确跟踪控制难题
- 传统** 雅可比(Jacobian) ** 控制器难以处理滞后引起的振荡,而现有学习方法对** 分布外(out-of-distribution) ** 轨迹泛化能力差
- 研究背景:TDCRs具有高度** 非线性(nonlinear) ** 、 ** 路径依赖(path-dependent) ** 动力学和** 非马尔可夫(non-Markovian)** 特性,控制挑战大
- 提出**参考增强离线学习框架(reference-augmented offline learning framework) ** ,用于6自由度跟踪控制
- 利用可微** RNN动力学代理(differentiable RNN-based dynamics surrogate) ** 作为** 梯度桥梁(gradient bridge) ** ,优化控制策略
- 通过** 多尺度增强方案(multi-scale augmentation scheme) ** 扩展参考分布,包含** 随机偏差(stochastic bias) ** 、 ** 谐波扰动(harmonic perturbations) ** 和** 随机游走(random walks)**
- **首创性** :首次将**参考增强(reference augmentation) ** 与** 离线学习(offline learning) ** 相结合,无需额外硬件交互即可提升控制策略的鲁棒性
- ** 多尺度扰动策略**:通过组合随机偏差、谐波扰动和随机游走,迫使策略** 内化(internalize) ** 多种跟踪误差恢复机制
- ** 梯度桥接**:利用可微RNN动力学代理作为桥梁,使策略优化能够通过动力学模型传播梯度,避免实际系统的危险性
- 为TDCRs提供了一种**数据高效(data-efficient) ** 的精确跟踪控制范式,平均位置误差降低** 50.9%**
- 在多种速度下,所提策略在** 精度(precision) ** 和** 稳定性(stability) ** 上显著优于雅可比方法和非增强基线
- 提出** 通用离线学习框架** ,可推广到其他具有复杂动力学的连续体机器人系统