研究动机:
• 解决LLM驱动的计算机使用代理(computer-use agents, CUAs)从直接操作转向监督协调时,现有监督机制作为孤立界面功能研究的问题
• 研究背景是缺乏对更广泛监督策略的系统比较框架
核心方法:
• 将CUA监督概念化为由委托结构(delegation structure)和参与程度(engagement level)定义的结构协调问题
• 在实时网络环境中对48名参与者进行混合方法(mixed-methods)研究
• 比较四种监督策略,结合定量和定性分析
核心创新点:
• 提出将CUA监督重新概念化为结构协调问题的新理论框架
• 发现监督策略更可靠地影响用户接触问题行为的概率,而非纠正能力
• 揭示基于计划(plan-based)的策略能降低代理问题行为发生率,但运行时干预成功率提升不均
• 关键发现:有效监督不取决于最大化人类参与,而取决于如何结构化监督以凸显关键决策时刻并支持及时识别
总体贡献:
• 建立了比较CUA监督策略的系统框架和分类维度
• 实证表明不同监督策略在问题预防、干预成功率和主观信任方面存在差异化影响
• 提出监督有效性取决于使风险时刻在执行过程中可识别为需要判断的关键见解
• 为设计更有效的CUA人机协作系统提供了实证基础和设计原则