← 返回论文列表

PSDesigner:模拟人类创意流程的自动化图形设计
PSDesigner: Automated Graphic Design with a Human-Like Creative Workflow

作者: Xincheng Shuai, Song Tang, Yutong Huang 等5人
arXiv: 2603.25738v1
分类: cs.CV
📝 论文摘要
平面设计是一种兼具创造性与创新性的过程,在电子商务、广告等应用场景中发挥着关键作用。然而,开发能够准确将用户意图转化为可编辑设计文件的自动化设计系统,目前仍是一个开放性的挑战。尽管近期研究借助强大的文本到图像模型和多模态大语言模型辅助平面设计,但这些方法通常简化了专业工作流程,导致灵活性与直观性受限。为突破这些局限,我们提出PSDesigner——一个模拟人类设计师创作流程的自动化平面设计系统。该系统基于多个专业化组件构建,能够根据用户指令收集主题相关素材,并自主推断和执行工具调用来操作设计文件,例如整合新素材或优化瑕疵元素。为赋予系统强大的工具使用能力,我们构建了设计数据集CreativePSD,其中包含大量高质量PSD设计文件,这些文件标注了涵盖广泛设计场景与艺术风格的操作轨迹,使模型能够学习专家级设计流程。大量实验表明,PSDesigner在多样化平面设计任务中均优于现有方法,使非专业人士也能便捷地创作出生产级质量的设计作品。

📊 核心分析

🎯 研究动机
该论文旨在解决自动化平面设计(graphic design)系统面临的挑战:如何将用户意图准确转化为可编辑的设计文件。现有方法通常简化专业工作流程,导致灵活性和直观性不足。
🔧 核心方法
论文提出了PSDesigner系统,其核心方法包括: - 构建一个模拟人类设计师创意工作流程的自动化系统 - 基于多个专用组件,根据用户指令收集主题相关素材(assets) - 自主推断并执行工具调用(tool calls)来操作设计文件(如整合新素材或优化劣质元素) - 创建CreativePSD数据集,包含大量高质量PSD设计文件,并标注了跨多种设计场景和艺术风格的操作轨迹(operation traces)
💡 核心创新
论文的核心创新点在于: - 首次提出模拟人类设计师完整创意工作流程的自动化设计系统,而非简化流程 - 通过构建大规模标注数据集CreativePSD,使模型能够学习专家设计程序,赋予系统强大的工具使用(tool-use)能力 - 实现了从用户指令到可编辑设计文件的端到端转换,保持了专业设计工具的灵活性和直观性
🏆 总体贡献
论文对该领域的整体贡献包括: - 提出了PSDesigner系统,在多样化平面设计任务上优于现有方法 - 创建了CreativePSD数据集,为学习设计程序提供了重要资源 - 使非专业人士能够方便地创建生产质量(production-quality)的设计作品 - 推动了自动化设计系统向更专业、更人性化的工作流程发展