- 现有**世界模型(world model)** 基于**循环状态空间(recurrent state space)** 架构,但缺乏物理结构,生成的动力学违反**守恒与耗散(conservation and dissipation)** 原理
- 需要一种机制引入物理先验,使潜空间具有物理结构化表示,同时保证能量一致性
- 视觉控制任务中,现有模型内部模拟器保真度不足,想象奖励与真实奖励对齐较差
- 提出**Port-Hamiltonian框架**,通过三个协同机制实现物理驱动的生成动力学
- 机制一:将隐式物理先验嵌入**循环转换(recurrent transition)**,将投影潜变量演化建模为**由流动与耗散控制的能量路由(action-controlled energy routing)**,使投影的PH相空间更紧凑且物理结构化
- 机制二:开发**运动学感知能量世界模型(kinematics-aware energy world model)**,从本体感受观测中估计**Hamiltonian** 和**功率平衡(power balance)**,为热力学推理提供显式物理信号
- 机制三:利用**能量梯度(energy gradients)** 建立**能量引导的Actor-Critic(energy-guided Actor-Critic)**,使用**拉格朗日乘子(Lagrangian multipliers)** 正则化策略优化,趋向低能量和平滑控制
- **首创性**:首次将**Port-Hamiltonian理论** 引入世界模型,使潜空间在物理约束下演化,突破传统无结构循环架构的局限
- **协同机制**:三个机制(物理先验嵌入、能量世界模型、能量引导策略优化)联合工作,实现从感知到控制的物理一致性
- **效率提升**:降低潜相空间体积4.18-8.41%,能量消耗最高7.80%,均方急动度(mean squared jerk)最高9.38%,同时提高内部模拟器保真度
- **低方差对齐**:在想象奖励与真实奖励之间建立更紧密、更低方差的匹配,显著提升策略优化的可靠性
- 为**世界模型(world model)** 领域提供了一种物理驱动的**Port-Hamiltonian生成动力学范式**,使潜空间具备守恒与耗散结构
- 在多个**视觉控制(visual control)** 基准上达到**更优渐近回报(superior asymptotic returns)**,同时提升内部模拟器的保真度
- 通过减少潜空间体积和能量消耗,证明了物理先验在提升模型效率与稳定性方面的有效性,促进具身智能与**物理世界模型(physics-world model)** 的交叉发展