该论文旨在解决微视频(micro-video)领域虚假信息检测的两个关键问题:
- 现有基准(benchmark)通常只关注单一欺骗类型,忽略了现实世界中虚假信息的多样性,例如多模态操纵(multimodal manipulation)、AI生成内容(AI-generated content)、认知偏差(cognitive bias)和脱离上下文(out-of-context)的再利用。
- 大多数检测模型缺乏细粒度的归因(attribution)分析,限制了模型的可解释性(interpretability)和实际应用价值。
论文提出了一个两阶段方法:
1. **构建WildFakeBench基准**:一个包含超过10,000个真实世界微视频的大规模基准,涵盖多种虚假信息类型和来源,每个视频都带有专家定义的归因标签(attribution labels)。
2. **开发FakeAgent框架**:一个受德尔菲法(Delphi)启发的多智能体推理框架(multi-agent reasoning framework),它整合了多模态理解(multimodal understanding)与外部证据检索,进行基于归因的分析(attribution-grounded analysis)。该框架联合分析视频内容和检索到的证据,以识别操纵、认知和AI生成模式,并检测脱离上下文的虚假信息。
论文的核心创新点在于:
- **基准创新**:首次构建了大规模、多样化、基于真实世界场景的微视频虚假信息基准(WildFakeBench),突破了现有基准通常只关注单一欺骗类型的局限。
- **方法创新**:提出了FakeAgent,一个新颖的多智能体推理框架,将多模态理解与外部证据检索深度融合,实现了对虚假信息的细粒度归因分析,而不仅仅是二分类检测。
- **任务定义创新**:将微视频虚假信息检测任务从简单的“真/假”分类,推进到对多种欺骗类型(如操纵、AI生成、认知偏差、脱离上下文)进行可解释的、基于归因的识别和分析。
论文对该领域的整体贡献是:
- **提供了新的基准和资源**:WildFakeBench为微视频虚假信息检测研究提供了一个现实且具有挑战性的测试平台(testbed),推动了该领域向更真实、更多样化的场景发展。
- **提出了新的方法论框架**:FakeAgent框架展示了如何通过多智能体推理整合多模态内容和外部证据,以实现更鲁棒(robust)、可解释的虚假信息检测,为未来的可解释人工智能(explainable AI)研究提供了新思路。
- **推动了任务范式的发展**:将研究重点从单纯的检测准确率提升,转向对虚假信息成因和类型的细粒度、可解释分析,增强了检测模型在实际应用(如辟谣(debunking))中的实用性。