- 透明物体因折射和反射导致**深度感知(depth sensing)** 不可靠,阻碍机器人精确感知与操控
- 现有方法依赖**多视角重建(multi-view reconstruction)** 或**深度补全(depth completion)**,难以在实际机器人系统中规模化部署
- 研究背景:透明物体在工业、物流、家庭等场景中普遍存在,急需一种可扩展且实用的单视图感知方案
- 提出基于**单视图RGB输入(single-view RGB input)** 的框架,直接预测**体素空间占据(voxel-space occupancy)**,提供几何感知表征
- 构建**模拟训练管道(simulation pipeline)**,自动生成大量RGB图像与体素占据标注对,涵盖多种材质与光照条件
- 采用简单的**规则式抓取策略(rule-based grasping strategy)**,基于预测的占据表示实现透明物体抓取
- **首创性**:首次将**单视图占据预测(single-view occupancy prediction)** 应用于透明物体感知,无需多视角或深度信息
- **迁移能力**:预测的占据表示对**域转移(domain shift)** 具有鲁棒性,无需微调即可从仿真直接迁移到真实世界
- **数据生成**:构建的模拟管道可大规模生成训练数据,解决透明物体标注困难的痛点,提升可扩展性
- 为**透明物体感知与操控(transparent object perception and manipulation)** 提供了一种实用、可扩展的范式,降低对专用传感器的依赖
- 在仿真和真实环境中验证了框架的**准确3D理解(accurate 3D understanding)** 与**可靠抓取性能(reliable grasp performance)**
- 推动了**仿真到真实(sim-to-real)** 迁移在机器人感知领域的应用,展示了单视图占据预测的潜力