该论文旨在解决自主水下航行器(AUV)被动记录数据时,容易错过具有高科学价值的瞬态事件的问题。研究背景是海洋生态系统退化需要持续、科学选择性的水下监测,而现有AUV大多作为被动数据记录器运行,无法进行主动感知。
论文提出了DINO-Explorer框架,其核心方法包括:
- 利用冻结的DINOv3基础模型的潜在空间(latent space)进行特征提取。
- 采用轻量级的、动作条件(action-conditioned)的循环预测器(recurrent predictor)来预测短时域语义演化。
- 设计了一个受传出副本(efference copy)启发的模块,利用全局池化的光流(globally pooled optical flow)来抵消自身运动引起的视觉变化,同时不抑制真实的环境新奇性。
- 在变体遥测约束下,将该信号用于异步事件分类的下游任务评估。
论文的核心创新点在于:
- 提出了一个由连续语义惊奇(semantic surprise)信号驱动的、新颖性感知(novelty-aware)的主动感知框架,实现了从被动记录到主动发现的转变。
- 创新性地将自身运动补偿(ego-motion compensation)机制整合到语义预测编码(semantic predictive coding)中,通过动作条件预测和光流补偿,有效区分了自身运动伪影和真实环境变化。
- 与未补偿的基线相比,该方法将误报(false positives)减少了45.5%,在保持高事件召回率的同时,显著提高了带宽效率(bandwidth efficiency)。
论文对该领域的总体贡献是:
- 为水下自主发现提供了一个鲁棒且带宽高效的注意力机制(attention mechanism),能够有效突出显示任务相关的现象。
- 在选定的工作点,系统在保持62.2%峰值F1分数(peak F1 score)的同时,将遥测带宽(telemetry bandwidth)减少了48.2%,成功将数据传输集中在人工验证的新奇事件周围。
- 通过严格的评估(包括帕累托消融研究(Pareto ablation study)),证明了DINO-Explorer在已验证的峰值F1与遥测带宽边界上具有鲁棒的主导性,为在线、主动的水下科学监测提供了可行的解决方案。