← 返回论文列表

基于核均值嵌入的无限时域遍历控制
Infinite-Horizon Ergodic Control via Kernel Mean Embeddings

作者: Christian Hughes, Ian Abraham
arXiv: 2604.01023v1
分类: cs.RO
📝 论文摘要
本文基于核均值嵌入方法,推导出一种适用于一般域上长时覆盖任务的无限时域遍历控制器。现有基于核的遍历控制方法虽能在一般覆盖域上提供强覆盖保证,但由于计算复杂度随规模增长而难以处理,其实际应用仅限于次遍历的有限时域场景,无法适用于长时覆盖任务。我们通过构建一种配备扩展核均值嵌入误差访问状态的无限时域遍历控制器来解决该可扩展性问题,该扩展状态能递归记录状态访问历史。这种扩展状态将历史访问与未来控制合成解耦,从而将遍历控制拓展至无限时域场景。此外,我们提出该控制器的一种变体,可在扩展误差状态下采用滚动时域控制框架运行。我们通过理论证明了所推导控制器的渐近收敛性,并展示其在二维与三维覆盖问题中保持遍历覆盖保证的特性。

📊 核心分析

🎯 研究动机
该论文旨在解决现有基于核的遍历控制方法在长期覆盖任务中面临的计算可扩展性问题。研究背景是:现有方法虽然能在一般覆盖域上提供强遍历性保证,但由于计算复杂度随规划时域呈指数增长,实际应用仅限于有限时域,无法适用于长期持续覆盖任务。
🔧 核心方法
论文提出了一种基于核均值嵌入(kernel mean embedding)的无限时域遍历控制器,其核心是引入了一个扩展的核均值嵌入误差访问状态,该状态能够递归地记录系统的历史状态访问信息。具体方法包括: - 设计一个扩展状态变量,将历史访问信息与未来控制合成解耦 - 提出一种在扩展误差状态上运行的重预测时域控制(receding-horizon control)变体 - 为2D和3D覆盖问题提供理论保证
💡 核心创新
论文的核心创新点在于: - 首次将遍历控制扩展到无限时域设置,突破了现有方法仅限于有限时域的限制 - 通过引入扩展的核均值嵌入误差状态,实现了历史访问信息的递归记录,使控制器能够持续跟踪长期覆盖性能 - 提出的重预测时域控制变体保持了遍历覆盖保证,同时具有实际可操作性 - 提供了控制器的渐近收敛性理论证明,确保了方法的理论完备性
🏆 总体贡献
论文对该领域的整体贡献包括: - 解决了基于核的遍历控制在长期覆盖任务中的计算可扩展性瓶颈 - 扩展了遍历控制理论的应用范围,使其能够处理无限时域覆盖问题 - 为2D和3D覆盖问题提供了具有理论保证的实用控制框架 - 通过理论证明和实验验证,建立了无限时域遍历控制的完整方法论