← 返回论文列表

通过区域-图范式编排空间语义以生成复杂室内场景
Orchestrating Spatial Semantics via a Zone-Graph Paradigm for Intricate Indoor Scene Generation

作者: Meisheng Zhang, Shizhao Sun, Yang Zhao 等6人
arXiv: 2605.02537v1
分类: cs.RO, cs.AI
📝 论文摘要
在非凸房间中,自治3D室内场景合成因空间约束的紧密耦合而失效。数据驱动的生成器缺乏用于长期规划的先验拓扑信息,而迭代式智能体则导致语义碎片化并在几何上变得脆弱。我们提出ZoneMaestro——一个统一框架,将范式从以物体为中心的合成转向区域图编排。通过内化一种新颖的基于区域的逻辑,ZoneMaestro将高层次语义意图转化为功能性区域与拓扑约束,从而实现对多种建筑形态的鲁棒适应。为此,我们构建了Zone-Scene-10K——一个包含显式区域图标注的大规模数据集。我们进一步引入交替对齐策略,在推理内化与区域感知的分组相对策略优化(Z-GRPO)之间循环迭代,在不依赖外部物理引擎的情况下有效调和了语义丰富性与几何有效性之间的张力。为严格评估超越凸基元的空间智能,我们正式定义了精细空间编排任务,并发布了SCALE——一个针对具有复杂密集空间关系的不规则室内场景的压力测试基准。大量实验表明,ZoneMaestro解决了密度-安全性二分问题,在结构连贯性和意图遵从性方面均显著优于当前最先进的基线方法。

📊 核心分析

🎯 研究动机
- 现有**自主3D室内场景合成(autonomous 3D indoor scene synthesis)** 方法在非凸房间中失效,无法处理紧密耦合的空间约束 - **数据驱动生成器(data-driven generator)** 缺乏拓扑先验,难以进行长时程规划;**迭代代理(iterative agent)** 方法语义碎片化且几何上脆弱 - 研究背景:智能室内设计需要从高层语义到几何布局的鲁棒映射,但现有方法在复杂不规则场景中表现不佳
🔧 核心方法
- 提出**ZoneMaestro** 统一框架,核心是**区域-图编排(Zone-Graph Orchestration)** 范式,将对象中心合成转换为区域中心推理 - 构建**Zone-Scene-10K** 大规模数据集,显式标注区域图(Zone-Graph)关系,提供拓扑先验 - 引入**交替对齐策略(Alternating Alignment Strategy)**,循环进行**推理内化(reasoning internalization)** 和**区域感知组相对策略优化(Z-GRPO)**,在不依赖外部物理引擎条件下平衡语义丰富性与几何有效性
💡 核心创新
- **范式转移**:首次从对象中心(object-centric)转向**区域-图(Zone-Graph)** 编排,利用高层区域逻辑适应多样建筑形态 - **无外部引擎优化**:通过交替对齐策略和Z-GRPO,在生成过程中内在调节几何与语义冲突,摆脱对物理引擎的依赖 - **新任务与基准**:正式定义**复杂空间编排(Intricate Spatial Orchestration)** 任务,并发布**SCALE** 压力测试基准,专门评估非凸、密集空间关系下的智能
🏆 总体贡献
- 为**室内场景生成(indoor scene generation)** 领域提供了**区域-图范式(Zone-Graph paradigm)**,统一语义与几何推理 - 构建了首个带区域图标注的大规模数据集**Zone-Scene-10K**,促进后续研究 - 提出**Z-GRPO** 优化策略,无需外部物理引擎即可解决**密度-安全困境(density-safety dichotomy)** - 在**SCALE** 基准上显著超越现有SOTA方法,在结构连贯性和意图遵循性上均有提升