- 解决**视觉地点识别(Visual Place Recognition, VPR)** 中**地图轻量化** 与**定位精度** 之间的权衡问题
- 现有**基础模型(foundation models)** 如DINOv2-ViT-S/14提供鲁棒的语义特征,但其**隐式流形(latent manifold)** 存在显著曲率,导致物理空间中的均匀线性运动在特征空间中投射为高度非线性轨迹
- 在稀疏锚点条件下,无法通过线性插值可靠重建描述子,阻碍了高精度定位
- 提出**FlatVPR** 范式,引入可学习的**残差适配器(Residual Adapter)** $\text{Res}(\cdot)$ 对原始基础特征进行校正:$\hat{\mathbf{z}} = \mathbf{z} + \text{Res}(\mathbf{z})$
- 设计**Pullback Flatness Loss**,通过数学上严谨的方式最小化相邻锚点之间中间特征与线性插值段的偏差,显式抑制流形曲率
- 将地图构建问题形式化为**期望最大化(Expectation-Maximization, EM)** 框架:连续M步进行流形适应,概念E步制定最优锚点选择准则
- **首创性**:首次提出**几何线性残差适配器(Geo-linear Residual Adapter)**,即插即用地校正基础模型特征流形的曲率
- **数学严谨性**:通过**Pullback Flatness Loss** 从微分几何角度最小化流形内在曲率,使任意两锚点间的描述子可经线性插值精确重建
- **解耦范式**:将VPR地图构建解耦为EM框架中的流形适应(M步)和锚点选择(E步),实现稀疏锚点下的高效定位
- 提出**FlatVPR** 这一新的几何校正范式,有效桥接了地图轻量化与定位精度的矛盾
- 在**NCLT数据集** 上,即使面对100米间隔的极端稀疏锚点和剧烈季节变化,依然取得显著性能提升
- 提供了一种**即插即用(plug-and-play)** 的适配器方法,可轻松集成到现有基础模型(如DINOv2)中,推动VPR在实际部署中的实用性