- 现有**多机器人任务分配(Multi-Robot Task Allocation, MRTA)** 方法通常依赖通信、已知任务模型或协调器,但在许多实际场景中这些条件不成立
- 论文定义了一个理论与实践之间存在空白的新设定——**零知识MRTA(Zero-Knowledge MRTA, ZK-MRTA)**:机器人团队无先验知识(无任务模型、无潜在秩)、无通信(无消息、无参数共享、无协调器),仅能部分且带私有噪声地观察队友结果的公共流
- 隐藏的低秩结构决定了哪个机器人适合哪个任务,且任务数量远多于回合数,因此大多数(机器人,任务)对从未被尝试过
- 需要解决的核心问题:每个机器人如何在没有直接尝试的情况下,对未知任务做出良好决策,并能适应新任务
- 提出**SwarmCF** 算法,即在广播的队友结果上运行**在线低秩协同过滤(online low-rank collaborative filtering)**
- 每个机器人维护自己的隐特征向量,通过观察公共流中其他机器人(及其噪声)的表现,在线更新隐因子,从而推断未尝试任务的奖励
- 利用低秩假设将问题转化为矩阵补全(matrix completion)的在线变体,在无通信情况下实现分布式推断
- **首次研究ZK-MRTA设定**:在无通信、无先验知识的极端条件下,证明了结构自由的学习器(无低秩假设)在未见(机器人,任务)对上的误差下界为**先验均值误差(prior-mean error floor)**,而SwarmCF能打破该下界,实现非平凡性能提升
- **样本复杂度突破**:每个机器人实现匹配的**样本复杂度(sample complexity)** Θ(d) 对比 Θ(n)(d为秩,n为任务数),即从线性依赖任务数降为线性依赖秩,体现了低秩结构带来的绝对优势
- **理论保证**:证明了一个确定性条件,在该条件下从掩码广播中解码出的低秩结构是精确的(实验验证);还证明了在任务稀缺下的**任意时间(anytime)** 累积奖励分离
- 为**分散式多机器人任务分配(decentralized MRTA)** 提供了一个新的理论框架和算法,填补了无通信、无知识的极端场景的空白
- 实验量化了广播的价值,发现**正向规模定律(positive scaling law)**:团队规模越大,每个机器人对未见任务的平均技能越高
- 在最强的**掩码鲁棒性(masking-robustness)** 和任意时间性能上优于其他低秩方法,恢复了集中式全通信天花板约80%的技能表现,且在容量为1的竞争及机器人感知实例中保持性能