该论文旨在解决大规模多智能体路径规划(Multi-Agent Path Finding, MAPF)中的核心协调问题。研究背景是:在机器人及信息物理系统中,多个智能体需要在有限的计算和通信资源下规划无冲突的轨迹。集中式最优求解器虽然能保证解的最优性,但其指数级计算复杂度限制了其在大规模系统和实时应用中的可扩展性。现有的分布式启发式方法速度更快,但会导致次优结果和高昂的成本差异。
论文提出了一种基于Karma机制的分布式协调框架。具体方法包括:
- 引入Karma机制:这是一种人工的、不可交易的信用,用于记录智能体过去的合作行为,并调节其未来的冲突解决决策。
- 将冲突解决建模为双边协商过程:使智能体能够通过成对重规划来解决冲突。
- 在具有运动学方向约束的终身机器人仓库多智能体取货-送货场景中进行评估。
论文的核心创新点在于:
- 首次将Karma机制(一种源自经济学和博弈论的概念)引入到分布式多智能体路径规划领域,用于促进长期公平性。
- 设计了一个无需全局优先级结构、在有限通信下运行的分布式协商框架,通过成对重规划解决冲突,同时利用Karma信用来调节决策,平衡智能体间的重规划负担。
- 与现有分布式启发式方法相比,该方法独特之处在于不仅关注即时效率,还通过信用机制 explicitly 地编码和促进长期合作与公平,从而在整体效率与个体公平性之间取得更好平衡。
论文对该领域的总体贡献是:
- 提出了一种新颖的、基于信用的分布式MAPF协调框架,为解决大规模、终身运行场景下的公平性与效率权衡问题提供了新思路。
- 通过实验验证了该机制能有效平衡智能体间的重规划努力,在不大幅牺牲整体效率的前提下,显著减少了服务时间的差异(即提高了公平性)。
- 为去中心化、合作式多智能体系统设计提供了可借鉴的机制设计范例,特别是在缺乏中央权威和全局通信的场景下。