- 现有**开放集全景分割(OPS)** 方法将已知类别视为扁平标签集,忽略语义层次结构,导致难以区分未知对象与分布内类别
- 安全关键应用(如自动驾驶、机器人)需要识别未知对象,但现有方法在训练中需要显式建模未知,泛化性受限
- 语义层次提供了有价值的结构先验,但尚未被充分用于OPS任务
- 提出**Hyp2Former**,一个端到端(end-to-end)框架,无需在训练时显式建模未知对象
- 在**双曲空间(hyperbolic space)** 中连续学习已知类别之间的**层次语义相似性(hierarchical semantic similarities)**
- 通过显式编码已知类别的层次关系,学习结构化嵌入空间,使未知对象因靠近高层概念而被检测
- **首次** 将**双曲空间嵌入(hyperbolic embeddings)** 用于开放集全景分割,编码语义层次先验
- 无需显式未知类建模,通过层次相似性自动发现未知对象,避免训练偏差
- 在已知类别鲁棒性与未知对象发现之间取得更优平衡,优于传统扁平标签方法
- 为**开放集全景分割(OPS)** 提供了一种利用语义层次结构的新范式,提升未知对象识别能力
- 在MS COCO、Cityscapes、Lost&Found等多个数据集上达到**最先进(SOTA)** 性能
- 证明了双曲空间嵌入在开放集视觉任务中的有效性,有望推广至其他语义分割任务