- 解决未知环境中的**自动优化(auto-optimization)** 问题,最优运行条件未知且随环境变化
- 现有**双控制探索与利用(Dual Control for Exploration and Exploitation, DCEE)** 方法计算负担大,主要依赖标准优化包或显式梯度更新律,未充分利用DCEE的数值结构
- 实时性要求高,现有方法难以在嵌入式平台上实现微秒级在线计算
- 揭示**奖励函数(reward function)** 具有**凸-非线性结构(convex-over-nonlinear structure)**,其中探索与利用项构成统一非线性残差映射,外层为凸损失
- 提出**结构利用数值方法(structure-exploiting numerical method)**,仅线性化非线性残差映射,保持凸外损失,将每个子问题转化为结构化凸形式
- 使用**广义高斯-牛顿(Gauss-Newton)** 海森近似,保证半正定性且仅依赖一阶导数,支持快速在线计算
- **首次利用DCEE的凸-非线性结构**,将子问题转化为结构化凸优化,避免传统非线性求解的复杂性
- **高效线性化策略**:仅线性化残差映射而不破坏凸外损失,确保子问题可靠求解
- **计算速度提升约一个数量级**,在典型车辆嵌入式CPU上最大计算时间仅83 μs,实现微秒级实时控制
- 为未知环境中的**自动优化** 提供了一种低复杂度实时DCEE方法,解决了计算瓶颈
- 通过**结构利用** 思想,将理论上的探索-利用权衡转化为可实际部署的快速算法
- 通过车辆巡航问题的仿真与硬件在环实验验证,证明了方法在控制性能与计算效率上的显著优势