← 返回论文列表

面向双手布料操作的合成数据生成与基于视觉的褶皱及关键点检测
Synthetic Data Generation and Vision-based Wrinkle and Keypoint Detection for Bimanual Cloth Manipulation

作者: Ariel Herrera, Xueyang Kang, Atal Anil Kumar
arXiv: 2606.06292v1
分类: cs.CV, cs.RO
📝 论文摘要
由于纺织品的连续变形和自遮挡阻碍了估计布料状态所需的鲁棒视觉感知,因此对纺织品进行机器人操作仍具挑战性。为解决标注真实世界数据匮乏的问题,我们开发了一套基于Blender的合成数据生成管线,可自动标注关键点;同时结合人工标注的渲染图像与真实世界数据,训练了一个褶皱检测器。我们提出了一种感知框架,整合了用于置换不变关键点检测的CNN和用于从结构性褶皱中提取抓取点的YOLOv8-OpenCV管线。基于该系统的双臂算法通过褶皱将完全折叠的衣物展开,并在出现角点时切换至基于关键点的熨烫模式。关键点模型的平均位置误差(MPE)达到1.7615像素。该感知系统无需微调即可迁移至物理布料,在高遮挡状态下优于失败的基线方法,且能避免在严重折叠区域产生误检。

📊 核心分析

🎯 研究动机
- 纺织品的机器人操作面临**连续变形(continuous deformation)** 和**自遮挡(self-occlusion)**,导致视觉感知难以准确估计布料状态 - 缺乏标注的真实世界数据,现有方法在高度遮挡状态或严重折叠时容易失败或产生误报 - 研究背景:双臂布料操作需要鲁棒的褶皱和关键点检测,但现有感知系统泛化能力不足
🔧 核心方法
- 开发基于**Blender** 的合成数据生成管道,自动输出**关键点(keypoint)** 标注,结合手动标注的渲染图像与真实数据训练**褶皱检测器(wrinkle detector)** - 提出感知框架:使用**卷积神经网络(CNN)** 进行**置换不变(permutation-invariant)** 关键点检测,以及**YOLOv8-OpenCV** 流水线从结构褶皱中提取**抓取点(grasping point)** - 设计双臂算法:通过褶皱检测拉伸完全折叠的衣物,当角落出现时过渡到基于关键点的**熨烫(ironing)** 操作
💡 核心创新
- **首创性**:首次结合**合成数据生成(synthetic data generation)** 与手动标注的渲染数据,实现无需真实场景微调的布料状态感知 - **方法创新**:将**置换不变CNN** 用于关键点检测,适应布料任意变形;**YOLOv8-OpenCV管道** 从褶皱中提取抓取点,区别于传统基于边缘或角点的方法 - **策略创新**:提出**双阶段双臂操作(strategy)**:先基于褶皱拉伸,再基于关键点熨烫,有效处理从完全折叠到部分展开的过渡 - **性能优势**:关键点检测达到**平均位置误差(MPE)** 1.7615像素,感知系统无需微调即可迁移到真实织物,优于在高度遮挡或严重折叠下失败的基线方法
🏆 总体贡献
- 为**双臂布料操作(bimanual cloth manipulation)** 提供了一套完整的感知-操作框架,包含合成数据生成、视觉检测和分级控制策略 - 自动标注的关键点合成管道降低了对昂贵人工标注的依赖,促进了数据增强 - 在关键点检测上实现了高精度,并证明了零微调迁移到真实场景的有效性 - 在高度遮挡和严重折叠的挑战性条件下,显著优于现有感知基线,推动了纺织物机器人操作的实际应用