← 返回论文列表

社会动态作为关键漏洞削弱大型语言模型集体中的客观决策能力
Social Dynamics as Critical Vulnerabilities that Undermine Objective Decision-Making in LLM Collectives

作者: Changgeon Ko, Jisu Shin, Hoyun Song 等6人
arXiv: 2604.06091v1
分类: cs.CL, cs.AI, cs.MA
📝 论文摘要
大型语言模型(LLM)智能体在多智能体环境中正日益扮演人类代理的角色,其中代表智能体需整合多方观点以作出最终决策。受社会心理学启发,本研究探讨了网络社交情境如何削弱代表智能体的可靠性。我们定义了四种关键现象——社会从众性、感知专业性、主导发言者效应和修辞说服力,并系统操控了对抗者数量、相对智能水平、论证长度及论证风格等变量。实验表明,随着社会压力增大,代表智能体的决策准确率持续下降:更大规模的对抗群体、更高能力的同伴以及更冗长的论证都会导致其性能显著降低。此外,强调可信度或逻辑性的修辞策略会根据具体情境进一步影响智能体的判断。这些发现揭示出,多智能体系统不仅受个体推理能力影响,更对其所处配置的社会动态具有敏感性,这凸显了人工智能代理中存在的关键脆弱性——其镜像反映了人类群体决策中观察到的心理偏见。

📊 核心分析

🎯 研究动机
该论文旨在解决大型语言模型(LLM)代理在多智能体环境中作为人类代表进行决策时,其决策的客观性如何被其所在网络的社会背景所削弱的问题。研究背景是LLM代理越来越多地在多智能体环境中充当人类代表,其中一个代表性代理需要整合多样化的同伴观点来做出最终决策。
🔧 核心方法
论文从社会心理学(social psychology)中汲取灵感,定义了四种关键社会现象:社会从众(social conformity)、感知专业度(perceived expertise)、主导发言者效应(dominant speaker effect)和修辞说服(rhetorical persuasion)。通过系统性地操控四个变量:对抗者数量、相对智能水平、论证长度和论证风格,在实验环境中检验这些社会动态如何影响代表性代理的决策可靠性。
💡 核心创新
论文的核心创新在于首次系统性地将社会心理学中关于人类群体决策偏见(biases)的理论框架(如从众压力、权威效应等)应用于分析和揭示多智能体系统(multi-agent systems)中LLM代理决策的脆弱性(vulnerabilities)。其独特之处在于: - 不是孤立地测试单个代理的推理能力,而是将代理置于模拟的社会网络(social network)压力下进行研究。 - 明确定义并量化了四种可操作的社会动态作为关键攻击向量(attack vectors)。 - 实验证明,即使代表代理本身具有客观决策的目标,其准确性也会因纯粹的社会情境因素(如对抗群体规模、同伴能力、论证长度和修辞风格)而显著下降,这揭示了AI代理决策中一种与人类相似的、基于社会情境的脆弱性模式。
🏆 总体贡献
论文对该领域的整体贡献是: - 揭示了多智能体系统的性能不仅取决于个体智能体的推理能力,还高度敏感于其配置中的社会动态(social dynamics)。 - 识别并实证了LLM集体(LLM collectives)中基于社会压力的关键脆弱性,这些脆弱性镜像了人类群体决策中观察到的心理偏见(psychological biases)。 - 为未来设计更鲁棒(robust)、更能抵抗社会操纵的AI代表系统提供了重要的实证依据和新的研究方向,强调了在构建多智能体系统时考虑社会因素的必要性。