该论文旨在解决非线性动力系统在存在潜在参数不确定性时的鲁棒控制问题。研究背景是:传统的分布鲁棒优化(Distributionally Robust Optimization, DRO)方法通常采用保守的最坏情况模糊集优化,这可能导致牺牲标称性能。现有方法在处理参数不确定性时,要么过于保守,要么依赖于对不确定性模型的限制性参数假设。
论文提出了一种Stein变分分布鲁棒控制器。该方法的核心是:
- 将最优控制与Stein变分推断(Stein Variational Inference)相结合。
- 使用基于确定性粒子的方法来近似任务相关的不确定性分布,避免了传统DRO中对模糊集的保守最坏情况优化。
- 该方法不依赖于不确定性模型的限制性参数假设,同时保持了计算并行性。
论文的核心创新点在于:
- **提出了一个统一的决策理论框架**:首次将鲁棒控制与变分推断在单一框架中融合,用于处理具有参数不确定性的广泛控制系统类别。
- **从“最坏情况”转向“任务相关”的鲁棒性**:与传统DRO关注最坏情况不同,本方法使控制器能够专注于对闭环性能影响最强烈的参数敏感性,从而围绕对任务目标最关键的相关不确定性来塑造控制律。
- **非参数化与并行化**:通过Stein变分推断避免了限制性的参数假设,同时保持了计算并行性,这是对传统方法的重要改进。
论文对该领域的总体贡献是:
- 提出了一种新颖的Stein变分不确定性自适应模型预测控制框架,为非线性系统参数不确定性的鲁棒控制提供了新范式。
- 在理论上和实践上调和了鲁棒控制与变分推断,实现了更好的性能-鲁棒性权衡。
- 在代表性控制问题上的实验表明,该方法在性能-鲁棒性权衡方面优于标称控制、集成方法以及经典的分布鲁棒基线方法。