PH-Dreamer：基于端口-哈密顿生成动力学的物理驱动世界模型

📝 论文摘要

基于循环状态空间架构构建的世界模型能够实现高效的潜在想象，但其物理结构仍显不足，产生的动力学过程违反了守恒与耗散原理。为此，我们提出了一种统一的端口-汉密尔顿框架，通过三种协同机制解决上述问题。首先，我们将投影潜在演化建模为由流与耗散控制的动作导向能量路由，将经验物理先验嵌入循环转场中，推动投影的端口-汉密尔顿相空间向更紧凑且物理结构化的表征偏移。其次，我们开发了一种运动学感知能量世界模型，通过本体感知观测估计汉密尔顿量与功率平衡，为热力学推理提供显式物理信号。第三，基于这些能量梯度，我们建立了一种能量引导的Actor-Critic方法，利用拉格朗日乘子对策略优化进行正则化，以降低能量并实现更平滑的控制。在视觉控制基准测试中，该范式不仅获得了更优的渐近回报，还通过缩小想象奖励与真实奖励之间的紧致低方差对齐提升了内部模拟器保真度，同时将潜在相空间体积压缩4.18%-8.41%，能耗降低最高达7.80%，均方加加速度降低最高达9.38%。

🎯 研究动机

- 现有**世界模型(world model)** 基于**循环状态空间(recurrent state space)** 架构，但缺乏物理结构，生成的动力学违反**守恒与耗散(conservation and dissipation)** 原理 - 需要一种机制引入物理先验，使潜空间具有物理结构化表示，同时保证能量一致性 - 视觉控制任务中，现有模型内部模拟器保真度不足，想象奖励与真实奖励对齐较差

🔧 核心方法

- 提出**Port-Hamiltonian框架**，通过三个协同机制实现物理驱动的生成动力学 - 机制一：将隐式物理先验嵌入**循环转换(recurrent transition)**，将投影潜变量演化建模为**由流动与耗散控制的能量路由(action-controlled energy routing)**，使投影的PH相空间更紧凑且物理结构化 - 机制二：开发**运动学感知能量世界模型(kinematics-aware energy world model)**，从本体感受观测中估计**Hamiltonian** 和**功率平衡(power balance)**，为热力学推理提供显式物理信号 - 机制三：利用**能量梯度(energy gradients)** 建立**能量引导的Actor-Critic(energy-guided Actor-Critic)**，使用**拉格朗日乘子(Lagrangian multipliers)** 正则化策略优化，趋向低能量和平滑控制

💡 核心创新

- **首创性**：首次将**Port-Hamiltonian理论** 引入世界模型，使潜空间在物理约束下演化，突破传统无结构循环架构的局限 - **协同机制**：三个机制（物理先验嵌入、能量世界模型、能量引导策略优化）联合工作，实现从感知到控制的物理一致性 - **效率提升**：降低潜相空间体积4.18-8.41%，能量消耗最高7.80%，均方急动度(mean squared jerk)最高9.38%，同时提高内部模拟器保真度 - **低方差对齐**：在想象奖励与真实奖励之间建立更紧密、更低方差的匹配，显著提升策略优化的可靠性

🏆 总体贡献

- 为**世界模型(world model)** 领域提供了一种物理驱动的**Port-Hamiltonian生成动力学范式**，使潜空间具备守恒与耗散结构 - 在多个**视觉控制(visual control)** 基准上达到**更优渐近回报(superior asymptotic returns)**，同时提升内部模拟器的保真度 - 通过减少潜空间体积和能量消耗，证明了物理先验在提升模型效率与稳定性方面的有效性，促进具身智能与**物理世界模型(physics-world model)** 的交叉发展

PH-Dreamer：基于端口-哈密顿生成动力学的物理驱动世界模型
PH-Dreamer: A Physics-Driven World Model via Port-Hamiltonian Generative Dynamics

📊 核心分析

PH-Dreamer：基于端口-哈密顿生成动力学的物理驱动世界模型 PH-Dreamer: A Physics-Driven World Model via Port-Hamiltonian Generative Dynamics

📊 核心分析

PH-Dreamer：基于端口-哈密顿生成动力学的物理驱动世界模型
PH-Dreamer: A Physics-Driven World Model via Port-Hamiltonian Generative Dynamics