SLAM作为部分信息下的随机控制问题：最优解与严格近似
SLAM as a Stochastic Control Problem with Partial Information: Optimal Solutions and Rigorous Approximations

作者: Ilir Gusija, Fady Alajaji, Serdar Yüksel

arXiv: 2604.21693v1

分类: cs.RO, math.OC

📝 论文摘要

同时定位与地图构建（SLAM）是机器人学中一项基础的状态估计问题，要求机器人在构建环境地图的同时准确定位自身位置。本文通过最优随机控制的视角研究主动SLAM问题，将其重构为部分信息下的决策问题。在回顾若干常用模型后，我们提出主动SLAM的一般随机控制框架，并对运动、感知与地图表征进行严格处理。针对信息采集动作的评估，我们引入一种新的探索阶段代价函数，该函数能够编码状态几何特征。这一基于非标准部分可观测马尔可夫决策过程（POMDP）的框架，经过分析推导出具有严格理论依据的近似最优解。为支撑该分析，我们在适用于广泛机器人应用的通用假设下研究了相关正则性条件。针对特定案例，我们开展大规模数值研究，采用标准学习算法学习近优策略。

📊 核心分析

🎯 研究动机

解决主动SLAM（simultaneous localization and mapping）问题，将其重新表述为部分信息下的最优随机控制问题，以克服现有方法缺乏严格理论分析和近似最优性保证的不足。

🔧 核心方法

将主动SLAM建模为非标准的部分可观测马尔可夫决策过程（POMDP），引入一种新的探索阶段代价函数（exploration stage cost），该函数在评估信息收集动作时编码了状态的几何结构，并基于此推导出具有严格理论保证的近似最优解。

💡 核心创新

提出一种编码状态几何结构的新探索阶段代价函数，将主动SLAM转化为非标准POMDP，并首次给出严格证明的近似最优解，同时建立了适用于广泛机器人应用的通用正则性条件。

🏆 总体贡献

为主动SLAM提供了最优随机控制的理论框架，通过严格分析推导出近似最优解，并通过数值实验验证了标准学习算法在该框架下学习近优策略的有效性，推动了SLAM问题从启发式方法向理论严谨的决策优化转变。

SLAM作为部分信息下的随机控制问题：最优解与严格近似 SLAM as a Stochastic Control Problem with Partial Information: Optimal Solutions and Rigorous Approximations

📊 核心分析

SLAM作为部分信息下的随机控制问题：最优解与严格近似
SLAM as a Stochastic Control Problem with Partial Information: Optimal Solutions and Rigorous Approximations