该论文旨在解决大型语言模型(LLM)代理在多智能体环境中作为人类代表进行决策时,其决策的客观性如何被其所在网络的社会背景所削弱的问题。研究背景是LLM代理越来越多地在多智能体环境中充当人类代表,其中一个代表性代理需要整合多样化的同伴观点来做出最终决策。
论文从社会心理学(social psychology)中汲取灵感,定义了四种关键社会现象:社会从众(social conformity)、感知专业度(perceived expertise)、主导发言者效应(dominant speaker effect)和修辞说服(rhetorical persuasion)。通过系统性地操控四个变量:对抗者数量、相对智能水平、论证长度和论证风格,在实验环境中检验这些社会动态如何影响代表性代理的决策可靠性。
论文的核心创新在于首次系统性地将社会心理学中关于人类群体决策偏见(biases)的理论框架(如从众压力、权威效应等)应用于分析和揭示多智能体系统(multi-agent systems)中LLM代理决策的脆弱性(vulnerabilities)。其独特之处在于:
- 不是孤立地测试单个代理的推理能力,而是将代理置于模拟的社会网络(social network)压力下进行研究。
- 明确定义并量化了四种可操作的社会动态作为关键攻击向量(attack vectors)。
- 实验证明,即使代表代理本身具有客观决策的目标,其准确性也会因纯粹的社会情境因素(如对抗群体规模、同伴能力、论证长度和修辞风格)而显著下降,这揭示了AI代理决策中一种与人类相似的、基于社会情境的脆弱性模式。
论文对该领域的整体贡献是:
- 揭示了多智能体系统的性能不仅取决于个体智能体的推理能力,还高度敏感于其配置中的社会动态(social dynamics)。
- 识别并实证了LLM集体(LLM collectives)中基于社会压力的关键脆弱性,这些脆弱性镜像了人类群体决策中观察到的心理偏见(psychological biases)。
- 为未来设计更鲁棒(robust)、更能抵抗社会操纵的AI代表系统提供了重要的实证依据和新的研究方向,强调了在构建多智能体系统时考虑社会因素的必要性。