AI Agent记忆系统综述：NUS与人大等高校框架与功能解析

AI快讯 2025-12-23

AI Agent记忆系统深度解析：NUS、人大等顶尖学府构建统一框架

在人工智能体（AI Agent）领域，记忆（Memory）已从两年前的“可选组件”迅速演变为不可或缺的“核心基础设施”。无论是需要记住用户习惯的对话助手、需掌握代码库结构的工程智能体，还是必须追踪研究证据链的深度探索型Agent，缺乏记忆能力的系统都难以跨越任务保留经验、维持用户偏好，或在长期协作中保持行为一致性。然而，随着“Agent Memory”概念的快速膨胀，其定义与实践也日益碎片化，不同研究在实现方式与评价标准上差异巨大。

为厘清这一复杂领域，来自新加坡国立大学（NUS）、中国人民大学、复旦大学、北京大学等机构的学者联合发布了长达百页的综述论文《Memory in the Age of AI Agents: A Survey》。该论文旨在为日益庞杂的Agent记忆研究提供一个统一的分析视角与技术梳理。

AI Agent记忆系统综述封面图 — 《Memory in the Age of AI Agents: A Survey》综述封面

论文链接: https://arxiv.org/abs/2512.13564
GitHub资源: https://github.com/Shichun-Liu/Agent-Memory-Paper-List

超越二分法：构建统一的“形式-功能-动态”三角框架

综述开篇即指出，传统的“长/短期记忆”二分法已无法刻画现代智能体系统中记忆的复杂形态。有的记忆以显式Token存储，有的内化于模型参数，有的则存在于潜在状态；其目的也各不相同，或为维护事实一致性，或为迁移经验，或为管理单次任务的工作区。

为此，论文提出了一个全新的Forms–Functions–Dynamics（形式-功能-动态）三角分析框架，旨在系统性地回答三个核心问题：

形式（Forms）：记忆以何种载体存在？是外部Token、模型参数还是潜在状态？
功能（Functions）：记忆旨在解决什么问题？是记录事实、积累经验还是管理当前工作？
动态（Dynamics）：记忆如何形成、演化并在决策中被检索利用？

Forms-Functions-Dynamics三角框架示意图 — Forms–Functions–Dynamics 统一分析框架

概念辨析：Agent Memory 与相关技术的本质区别

在实践中，“记忆”常被简化为向量数据库检索或更长的上下文窗口。然而，综述明确指出，这些技术与真正的Agent Memory在问题层级上并不等价。

Agent Memory：关注的是智能体持久且可自我演化的认知状态。它不仅是存储，更强调在交互中持续更新、整合、抽象，并跨任务保持一致性，核心是“智能体知道什么、经历过什么以及如何变化”。
LLM Memory：更侧重于模型内部计算过程中对长序列信息的保留机制，如缓解早期Token信息衰减、优化长距离依赖建模等，其研究不必然与智能体的长期存在和自主决策绑定。
RAG（检索增强生成）：本质是静态知识访问。它可以是Agent Memory的一种实现方式，但若缺乏长期一致性、演化机制和跨任务的“自我”意识，则更接近一个知识检索模块。
Context Engineering（上下文工程）：属于优化当下推理的外部脚手架，关注如何组织、压缩提示信息。而Agent Memory则是支持学习与自主性的、跨会话的持续认知基底。

深度解析：记忆的形式、功能与动态机制

1. 记忆的三种形式（Forms）

综述将记忆载体归纳为三类，各有其权衡：

Token-level Memory（Token级记忆）：最显式、透明的形式。信息以持久、离散的单元（如文本、视觉Token）存储，具备可编辑、易组合的优势。根据拓扑复杂度，又可细分为：
- Flat Memory（一维）：无结构序列，简单但检索效率低。
- Planar Memory（二维）：单层图/树结构，支持关系推理。
- Hierarchical Memory（三维）：多层立体结构，兼顾细节与抽象。
Parametric Memory（参数记忆）：将记忆“写入”模型权重，如同内化的直觉。优点是无需显式检索，但存在更新成本高、难以精确编辑和易发生灾难性遗忘等问题。
Latent Memory（潜在记忆）：信息存在于模型内部隐状态或连续表示中，可在推理时动态更新。它比Token级记忆更紧凑，比参数记忆更易更新，但可解释性较差。

Token-level Memory的三种拓扑结构示意图 — Token-level Memory的三种拓扑结构

2. 记忆的三种功能（Functions）

摒弃时间尺度，按功能角色将记忆分为三类，对应不同的设计目标和失败模式：

事实记忆（Factual Memory）：记录来自用户与环境的客观知识（如用户偏好、代码库结构、工具状态）。目标是构建一个可更新、可检索、可治理的外部事实层，防止信息在历史对话中散失、被遗忘或编造。
经验记忆（Experiential Memory）：从历史任务轨迹中提炼可复用的策略与技能，实现“吃一堑，长一智”。按抽象层级分为：基于案例的原始记录、基于策略的推理模式、基于技能的可执行代码块。它赋予智能体内省和编辑自身程序性知识的能力。
工作记忆（Working Memory）：管理单次任务实例中的海量、高维即时信息（如长文档、视频流），在有限的注意力预算内建立高效的“思维工作区”。包括单轮内的信息压缩和多轮间的状态维持。