← 返回论文列表

斯坦变分不确定性自适应模型预测控制
Stein Variational Uncertainty-Adaptive Model Predictive Control

作者: Hrishikesh Sathyanarayan, Ian Abraham
arXiv: 2604.01034v1
分类: cs.RO, math.OC
📝 论文摘要
我们提出了一种针对具有潜在参数不确定性的非线性动态系统的斯坦因变分分布鲁棒控制器。该方法替代了保守的最坏情况模糊集优化,通过基于粒子的确定性近似来捕捉任务相关的不确定性分布,使控制器能够聚焦于对闭环性能影响最显著的参数敏感性。我们的方法通过将最优控制与斯坦因变分推断相结合,生成对潜在参数不确定性具有鲁棒性的控制器,在保持计算并行性的同时避免了对不确定性模型的限制性参数假设。与可能因最坏情况设计而牺牲名义性能的经典分布鲁棒优化不同,我们的方法通过围绕对任务目标最关键的相关不确定性塑造控制律来实现鲁棒性。因此,所提出的框架在单一决策理论表述中,为具有参数不确定性的广泛控制系统类别统一了鲁棒控制与变分推断。我们在代表性控制问题上验证了该方法,实验结果表明其相较于名义控制、集成控制及经典分布鲁棒基线方法,实现了更优的性能-鲁棒性权衡。

📊 核心分析

🎯 研究动机
该论文旨在解决非线性动力系统在存在潜在参数不确定性时的鲁棒控制问题。研究背景是:传统的分布鲁棒优化(Distributionally Robust Optimization, DRO)方法通常采用保守的最坏情况模糊集优化,这可能导致牺牲标称性能。现有方法在处理参数不确定性时,要么过于保守,要么依赖于对不确定性模型的限制性参数假设。
🔧 核心方法
论文提出了一种Stein变分分布鲁棒控制器。该方法的核心是: - 将最优控制与Stein变分推断(Stein Variational Inference)相结合。 - 使用基于确定性粒子的方法来近似任务相关的不确定性分布,避免了传统DRO中对模糊集的保守最坏情况优化。 - 该方法不依赖于不确定性模型的限制性参数假设,同时保持了计算并行性。
💡 核心创新
论文的核心创新点在于: - **提出了一个统一的决策理论框架**:首次将鲁棒控制与变分推断在单一框架中融合,用于处理具有参数不确定性的广泛控制系统类别。 - **从“最坏情况”转向“任务相关”的鲁棒性**:与传统DRO关注最坏情况不同,本方法使控制器能够专注于对闭环性能影响最强烈的参数敏感性,从而围绕对任务目标最关键的相关不确定性来塑造控制律。 - **非参数化与并行化**:通过Stein变分推断避免了限制性的参数假设,同时保持了计算并行性,这是对传统方法的重要改进。
🏆 总体贡献
论文对该领域的总体贡献是: - 提出了一种新颖的Stein变分不确定性自适应模型预测控制框架,为非线性系统参数不确定性的鲁棒控制提供了新范式。 - 在理论上和实践上调和了鲁棒控制与变分推断,实现了更好的性能-鲁棒性权衡。 - 在代表性控制问题上的实验表明,该方法在性能-鲁棒性权衡方面优于标称控制、集成方法以及经典的分布鲁棒基线方法。