← 返回论文列表

机器人辅助肾部分切除术中肾缝合的细粒度动作分割
Fine-Grained Action Segmentation for Renorrhaphy in Robot-Assisted Partial Nephrectomy

作者: Jiaheng Dai, Huanrong Liu, Tailai Zhou 等10人
arXiv: 2604.09051v1
分类: cs.CV, cs.RO
📝 论文摘要
在机器人辅助肾部分切除术的肾缝合阶段,精细动作分割需要对视觉相似但持续时间可变、存在显著类别不平衡的缝合手势进行逐帧识别。SIA-RAPN基准基于达芬奇Xi系统采集的50段临床视频定义了该任务,视频数据标注了12种逐帧动作标签。该基准比较了四种基于I3D特征构建的时序模型:MS-TCN++、AsFormer、TUT和DiffAct。评估指标采用平衡准确率、编辑分数、重叠阈值为10%、25%和50%的分段F1分数、逐帧准确率以及逐帧平均精度均值。除在SIA-RAPN五种公开划分配置上进行主要评估外,基准还报告了在独立单孔RAPN数据集上的跨域结果。在主要数据集五次运行中的最优结果中,DiffAct在F1分数、逐帧准确率、编辑分数和逐帧平均精度均值上表现最佳,而MS-TCN++获得了最高的平衡准确率。

📊 核心分析

🎯 研究动机
该论文旨在解决机器人辅助肾部分切除术中肾实质缝合阶段的细粒度动作分割问题。研究背景是:在临床视频中,缝合手势视觉相似、持续时间可变且存在严重的类别不平衡,这给帧级识别带来了挑战。
🔧 核心方法
论文在SIA-RAPN基准数据集上,基于I3D特征,系统性地比较了四种时序模型: - MS-TCN++ - AsFormer - TUT - DiffAct 评估指标包括:平衡准确率、编辑分数、在10%、25%和50%重叠阈值下的分段F1分数、帧级准确率以及帧级平均精度均值。
💡 核心创新
论文的核心创新在于: - 首次为机器人辅助肾部分切除术中的肾实质缝合阶段,建立并系统评估了一个细粒度动作分割的基准(SIA-RAPN)。 - 不仅在主数据集上进行了全面的模型比较,还额外报告了在单端口RAPN数据集上的跨域结果,验证了模型的泛化能力。 - 明确指出在特定评估指标下,DiffAct和MS-TCN++模型分别取得了最优性能,为临床视频分析提供了具体的模型选择指导。
🏆 总体贡献
论文对该领域的整体贡献是: - 定义并发布了SIA-RAPN基准数据集(包含50段达芬奇Xi系统的临床视频及12个帧级标签),为手术动作分析领域提供了一个新的、具有挑战性的标准测试平台。 - 通过严谨的实验设计(五种数据划分配置)和全面的评估指标,为细粒度手术动作分割任务建立了可靠的性能评估标准。 - 其跨域评估结果,为推动手术人工智能模型从实验室走向多样化的临床实际应用场景提供了重要参考。