← 返回论文列表

作用于未知:面向分散式多机器人任务分配的无通信协同过滤
Acting on the Unseen: Communication-Free Collaborative Filtering for Decentralized Multi-Robot Task Allocation

作者: Alexander Apartsin, Yigal Meshulam, Yehudit Aperstein
arXiv: 2605.25584v1
分类: cs.RO, cs.AI
📝 论文摘要
多机器人任务分配通常假设通信、已知任务模型或协调器的某种组合。我们研究相反的极端情况——一种在实践中常见但在理论上被忽视的机制,我们称之为零知识MRTA(ZK-MRTA):一个没有先验知识(无任务模型,甚至不知道潜在等级)、没有通信(无消息、无参数共享、无协调器)、仅对队友结果的公共流具有部分且带有私有噪声视角的机器人团队。一个隐藏的低秩结构控制着哪个机器人适合哪个任务,且任务数量远多于轮次,因此大多数(机器人,任务)对从未被尝试。然而,每个机器人能通过在线低秩协同过滤在广播(SwarmCF)上运行,在其从未尝试的任务以及新任务上表现良好。与任何无结构学习器相比,优势是绝对的,而非一个常数因子:无结构学习器在未见对上的误差被证明处于先验均值下界。我们证明了匹配的每机器人样本复杂度(在等级d和任务数n下,Θ(d)相比于Θ(n))、任务稀缺下的随时(累积奖励)分离,以及一个确定性条件——在该条件下从掩码广播的分散式恢复是精确的(经实验验证)。实验量化了广播的价值、正比缩放律(每机器人未见对技能随团队规模增加而提升),以及低秩方法中最强的掩码鲁棒性和随时性能,恢复了集中式全通信上限的大部分(约80%的技能收益),并在容量为1的竞争和基于机器人的感知实例中保持有效。

📊 核心分析

🎯 研究动机
- 现有**多机器人任务分配(Multi-Robot Task Allocation, MRTA)** 方法通常依赖通信、已知任务模型或协调器,但在许多实际场景中这些条件不成立 - 论文定义了一个理论与实践之间存在空白的新设定——**零知识MRTA(Zero-Knowledge MRTA, ZK-MRTA)**:机器人团队无先验知识(无任务模型、无潜在秩)、无通信(无消息、无参数共享、无协调器),仅能部分且带私有噪声地观察队友结果的公共流 - 隐藏的低秩结构决定了哪个机器人适合哪个任务,且任务数量远多于回合数,因此大多数(机器人,任务)对从未被尝试过 - 需要解决的核心问题:每个机器人如何在没有直接尝试的情况下,对未知任务做出良好决策,并能适应新任务
🔧 核心方法
- 提出**SwarmCF** 算法,即在广播的队友结果上运行**在线低秩协同过滤(online low-rank collaborative filtering)** - 每个机器人维护自己的隐特征向量,通过观察公共流中其他机器人(及其噪声)的表现,在线更新隐因子,从而推断未尝试任务的奖励 - 利用低秩假设将问题转化为矩阵补全(matrix completion)的在线变体,在无通信情况下实现分布式推断
💡 核心创新
- **首次研究ZK-MRTA设定**:在无通信、无先验知识的极端条件下,证明了结构自由的学习器(无低秩假设)在未见(机器人,任务)对上的误差下界为**先验均值误差(prior-mean error floor)**,而SwarmCF能打破该下界,实现非平凡性能提升 - **样本复杂度突破**:每个机器人实现匹配的**样本复杂度(sample complexity)** Θ(d) 对比 Θ(n)(d为秩,n为任务数),即从线性依赖任务数降为线性依赖秩,体现了低秩结构带来的绝对优势 - **理论保证**:证明了一个确定性条件,在该条件下从掩码广播中解码出的低秩结构是精确的(实验验证);还证明了在任务稀缺下的**任意时间(anytime)** 累积奖励分离
🏆 总体贡献
- 为**分散式多机器人任务分配(decentralized MRTA)** 提供了一个新的理论框架和算法,填补了无通信、无知识的极端场景的空白 - 实验量化了广播的价值,发现**正向规模定律(positive scaling law)**:团队规模越大,每个机器人对未见任务的平均技能越高 - 在最强的**掩码鲁棒性(masking-robustness)** 和任意时间性能上优于其他低秩方法,恢复了集中式全通信天花板约80%的技能表现,且在容量为1的竞争及机器人感知实例中保持性能