该论文旨在解决高风险边缘部署场景下的自动化谈判问题。研究背景是:
- 大语言模型(LLM)虽然广泛用于自动化谈判,但其高计算成本和隐私风险限制了在移动助手、救援机器人等隐私敏感的边缘设备上的部署。
- 小语言模型(SLM)虽可作为替代,但难以处理高风险谈判中复杂的情绪动态。
论文提出了EmoMAS系统,这是一个贝叶斯(Bayesian)多智能体框架,具体方法包括:
- 采用一个贝叶斯编排器(Bayesian orchestrator)来协调三个专门化的智能体:博弈论(game-theoretic)模型、强化学习(reinforcement learning)模型和心理一致性(psychological coherence)模型。
- 系统融合这些智能体的实时洞察,以优化情绪状态转换,同时根据谈判反馈持续更新智能体的可靠性。
- 采用混合智能体(mixture-of-agents)架构,支持无需预训练的在线策略学习。
论文的核心创新点在于:
- **将情绪决策从被动反应转变为战略变量**:通过贝叶斯多智能体优化框架,将情绪表达视为可优化的战略变量,而非简单的反应输出。
- **贝叶斯编排的混合智能体架构**:创新性地使用贝叶斯编排器动态协调和融合博弈论、强化学习和心理学模型的实时输出,实现战略性的情绪智能。
- **面向边缘部署的高风险谈判基准**:引入了涵盖债务、医疗、应急响应和教育四个领域的、适用于边缘部署的高风险谈判基准测试集。
- **实现了无需预训练的在线学习**:该架构允许系统在谈判过程中直接学习和适应,无需预先训练。
论文对该领域的整体贡献包括:
- **提出并验证了一个新的谈判AI范式**:通过将情绪作为战略变量进行贝叶斯优化,EmoMAS为有效、私密且自适应的谈判AI建立了新范式,特别适合高风险边缘部署。
- **显著提升了谈判性能**:实验表明,无论是SLM还是LLM,配备EmoMAS后,在所有基准测试中的谈判表现均持续超越所有基线模型,同时平衡了伦理行为。
- **证明了战略性情绪智能的关键作用**:研究结果明确了战略性情绪智能是谈判成功的关键驱动因素。
- **推动了边缘AI的发展**:为解决边缘设备上隐私敏感、计算受限场景下的复杂交互问题提供了可行的框架。