- 现行**具身智能体(embodied agent)** 内存架构(如Generative Agents、MemGPT)将内存视为文本流或知识图谱,无法同时支持按语义、空间和时间的多维度检索
- 具身智能体在物理环境中操作,需要一种既能按含义搜索、又能按空间位置和时间戳访问的内存系统
- 现有基准(如LoCoMo、OpenEQA)提供表面任务评估,但缺乏基于认知心理学范式的诊断性可解释评测
- 提出**eMEM(Embodied Memory)** 混合图内存系统,采用**多索引架构(multi-index architecture)**:SQLite负责结构化存储、hnswlib用于近似最近邻语义搜索、R-tree处理空间查询,统一在单一图模型下
- 设计**层级整合流水线(tiered consolidation pipeline)**,将原始感知观测转化为压缩摘要,模仿生物系统中的海马-新皮质巩固过程
- 提供**十个智能体可调用回忆工具(agent-facing recall tools)**,包括概念到位置解析和跨层回忆等原语,供LLM工具调用
- 构建**eMEM-Bench v1** 基准,基于ProcTHOR-10K场景,围绕八种认知心理学范式(如DRM诱饵、模式分离、长期干扰等)组织探针评估
- **首创性**:首个同时集成**语义搜索、空间索引和时间结构化存储** 的混合图内存系统,专为具身智能体设计
- **生物启发**:层级整合流水线直接类比**海马-新皮质巩固(hippocampal-neocortical consolidation)**,实现从原始感知到压缩摘要的记忆转换
- **诊断性基准**:eMEM-Bench基于认知心理学范式,提供可解释的评估维度(如保留曲线、DRM诱饵拒绝),超越现有表面任务基准
- **效率与贡献分离**:通过纯RAG基线(flat_rag)消融实验,证明多层存储和巩固分别贡献了30分以上的性能提升
- 为具身智能体领域提供了一种**多维度可检索混合图内存系统**,填补了现有方法在时空-语义联合检索上的空白
- 在eMEM-Bench v1(988个探针)上达到**80.8加权平均分**,保留曲线在1小时到1年模拟延迟内保持平坦,验证了长期记忆的稳定性
- 开源**eMEM系统与eMEM-Bench v1基准代码**,促进社区复现、评估与后续研究