- 解决**视觉运动策略(visuomotor policy)** 中生成平滑连贯轨迹的挑战,需要平衡近端精确性(proximal precision)与远端前瞻性(distal foresight)
- 现有方法仅优化块内(intra-chunk)动作分布,忽略了块间(inter-chunk)连贯性,导致长时域动作不连续,学习困难
- 提出**FocalPolicy** 框架,结合**频率优化分块(Frequency-Optimized Chunking)** 和**局部锚定流匹配(Locally Anchored Flow Matching)**
- 引入**前瞻复合目标(foresight composite objective)**:在近端动作上监督时域(time-domain)对齐,同时在多个未来动作块上正则化频域(frequency-domain)结构以提升跨块连贯性
- 设计**局部锚定采样(locally anchored sampling)**,在**一致性流匹配(consistency flow matching)** 训练中增强目标信号传播效率
- **首创频域正则化**:通过频率优化分块,在频域维度对多个未来动作块进行结构约束,显式改善块间不连续问题
- **局部锚定流匹配机制**:改进一致性流匹配的训练采样方式,高效学习复杂动作分布,提升目标信号传播效率
- **前瞻性平衡策略**:同时优化近端时域对齐与远端频域结构,实现精确性与前瞻性的协同平衡,优于仅关注单一块内分布的现有方法
- 提出一种新颖的**FocalPolicy** 框架,在**平滑连贯轨迹生成** 任务上显著超越现有方法
- 所提模块具有**泛化性(generalizability)**,可迁移至其他基线模型,验证其可作为通用的插件提升性能
- 公开项目网站与相关代码,促进社区复现与后续研究