该论文旨在解决机器人辅助肾部分切除术中肾实质缝合阶段的细粒度动作分割问题。研究背景是:在临床视频中,缝合手势视觉相似、持续时间可变且存在严重的类别不平衡,这给帧级识别带来了挑战。
论文在SIA-RAPN基准数据集上,基于I3D特征,系统性地比较了四种时序模型:
- MS-TCN++
- AsFormer
- TUT
- DiffAct
评估指标包括:平衡准确率、编辑分数、在10%、25%和50%重叠阈值下的分段F1分数、帧级准确率以及帧级平均精度均值。
论文的核心创新在于:
- 首次为机器人辅助肾部分切除术中的肾实质缝合阶段,建立并系统评估了一个细粒度动作分割的基准(SIA-RAPN)。
- 不仅在主数据集上进行了全面的模型比较,还额外报告了在单端口RAPN数据集上的跨域结果,验证了模型的泛化能力。
- 明确指出在特定评估指标下,DiffAct和MS-TCN++模型分别取得了最优性能,为临床视频分析提供了具体的模型选择指导。
论文对该领域的整体贡献是:
- 定义并发布了SIA-RAPN基准数据集(包含50段达芬奇Xi系统的临床视频及12个帧级标签),为手术动作分析领域提供了一个新的、具有挑战性的标准测试平台。
- 通过严谨的实验设计(五种数据划分配置)和全面的评估指标,为细粒度手术动作分割任务建立了可靠的性能评估标准。
- 其跨域评估结果,为推动手术人工智能模型从实验室走向多样化的临床实际应用场景提供了重要参考。