作用于未知：面向分散式多机器人任务分配的无通信协同过滤

📝 论文摘要

多机器人任务分配通常假设通信、已知任务模型或协调器的某种组合。我们研究相反的极端情况——一种在实践中常见但在理论上被忽视的机制，我们称之为零知识MRTA（ZK-MRTA）：一个没有先验知识（无任务模型，甚至不知道潜在等级）、没有通信（无消息、无参数共享、无协调器）、仅对队友结果的公共流具有部分且带有私有噪声视角的机器人团队。一个隐藏的低秩结构控制着哪个机器人适合哪个任务，且任务数量远多于轮次，因此大多数（机器人，任务）对从未被尝试。然而，每个机器人能通过在线低秩协同过滤在广播（SwarmCF）上运行，在其从未尝试的任务以及新任务上表现良好。与任何无结构学习器相比，优势是绝对的，而非一个常数因子：无结构学习器在未见对上的误差被证明处于先验均值下界。我们证明了匹配的每机器人样本复杂度（在等级d和任务数n下，Θ(d)相比于Θ(n)）、任务稀缺下的随时（累积奖励）分离，以及一个确定性条件——在该条件下从掩码广播的分散式恢复是精确的（经实验验证）。实验量化了广播的价值、正比缩放律（每机器人未见对技能随团队规模增加而提升），以及低秩方法中最强的掩码鲁棒性和随时性能，恢复了集中式全通信上限的大部分（约80%的技能收益），并在容量为1的竞争和基于机器人的感知实例中保持有效。

🎯 研究动机

- 现有**多机器人任务分配(Multi-Robot Task Allocation, MRTA)** 方法通常依赖通信、已知任务模型或协调器，但在许多实际场景中这些条件不成立 - 论文定义了一个理论与实践之间存在空白的新设定——**零知识MRTA(Zero-Knowledge MRTA, ZK-MRTA)**：机器人团队无先验知识（无任务模型、无潜在秩）、无通信（无消息、无参数共享、无协调器），仅能部分且带私有噪声地观察队友结果的公共流 - 隐藏的低秩结构决定了哪个机器人适合哪个任务，且任务数量远多于回合数，因此大多数（机器人，任务）对从未被尝试过 - 需要解决的核心问题：每个机器人如何在没有直接尝试的情况下，对未知任务做出良好决策，并能适应新任务

🔧 核心方法

- 提出**SwarmCF** 算法，即在广播的队友结果上运行**在线低秩协同过滤(online low-rank collaborative filtering)** - 每个机器人维护自己的隐特征向量，通过观察公共流中其他机器人（及其噪声）的表现，在线更新隐因子，从而推断未尝试任务的奖励 - 利用低秩假设将问题转化为矩阵补全(matrix completion)的在线变体，在无通信情况下实现分布式推断

💡 核心创新

- **首次研究ZK-MRTA设定**：在无通信、无先验知识的极端条件下，证明了结构自由的学习器（无低秩假设）在未见（机器人，任务）对上的误差下界为**先验均值误差(prior-mean error floor)**，而SwarmCF能打破该下界，实现非平凡性能提升 - **样本复杂度突破**：每个机器人实现匹配的**样本复杂度(sample complexity)** Θ(d) 对比 Θ(n)（d为秩，n为任务数），即从线性依赖任务数降为线性依赖秩，体现了低秩结构带来的绝对优势 - **理论保证**：证明了一个确定性条件，在该条件下从掩码广播中解码出的低秩结构是精确的（实验验证）；还证明了在任务稀缺下的**任意时间(anytime)** 累积奖励分离

🏆 总体贡献

- 为**分散式多机器人任务分配(decentralized MRTA)** 提供了一个新的理论框架和算法，填补了无通信、无知识的极端场景的空白 - 实验量化了广播的价值，发现**正向规模定律(positive scaling law)**：团队规模越大，每个机器人对未见任务的平均技能越高 - 在最强的**掩码鲁棒性(masking-robustness)** 和任意时间性能上优于其他低秩方法，恢复了集中式全通信天花板约80%的技能表现，且在容量为1的竞争及机器人感知实例中保持性能

作用于未知：面向分散式多机器人任务分配的无通信协同过滤
Acting on the Unseen: Communication-Free Collaborative Filtering for Decentralized Multi-Robot Task Allocation

📊 核心分析

作用于未知：面向分散式多机器人任务分配的无通信协同过滤 Acting on the Unseen: Communication-Free Collaborative Filtering for Decentralized Multi-Robot Task Allocation

📊 核心分析

作用于未知：面向分散式多机器人任务分配的无通信协同过滤
Acting on the Unseen: Communication-Free Collaborative Filtering for Decentralized Multi-Robot Task Allocation