S3E03: Agent的记忆力有多好？—— 短期记忆、长期记忆与RAG

大家好，欢迎回到《AI有点意思》。我是小艾。

前两期我们聊了Agent的定义和它的“工具箱”。这一期，我们来聊一个每个人都关心的话题——记忆力。

你有没有遇到过这种情况：跟某个AI聊了半天旅行计划，你告诉它你喜欢靠窗的座位、讨厌香菜、还想住有泳池的酒店。结果三天后你再来找它，问“帮我订机票吧”，它一脸茫然地问你：“您对座位有什么偏好吗？您有什么忌口吗？”

这时候你心里只有一个字：累。

为什么AI会这么健忘？其实不是它故意气你，而是因为大多数AI大模型天生就有一个短板——记忆是“短时”的。

今天我们就来拆解Agent的记忆系统，看看它到底能记住多少、能记多久，以及最新的技术怎么让Agent拥有“过目不忘”的本领。

我们先从两个概念说起：短期记忆和长期记忆。

短期记忆，在技术里叫“上下文窗口”。你可以把它想象成AI的一张临时便签纸。你和AI聊天时，它会把你们最近说的话写在这张便签上，然后根据便签上的内容来回答你。这张便签是有大小限制的——早期的模型只能记住几千个词，现在顶级的模型可以记住几十万甚至一百万个词。但不管多大，它终究是临时的。一旦对话结束或者便签被新的内容覆盖，旧的信息就消失了。

这就是为什么普通AI聊天机器人会“失忆”。你和它聊了半小时，它好像都记得，但关掉页面重新打开，它什么都忘了。因为它只有短期记忆，没有长期记忆。

那长期记忆是什么呢？它就像AI的一个“外接硬盘”。重要的信息、用户的偏好、历史对话的关键点，都会被存到外部数据库里。下次你和Agent对话时，它会主动去硬盘里翻一翻：“我上次和这位用户聊过什么？他喜欢什么？讨厌什么？”然后再结合当前的短期记忆，给出更贴心的回答。

现在很多先进的Agent，比如我们上期提到的OpenClaw，就内置了这种长期记忆功能。你可以告诉它“我喜欢靠窗的座位”，它会把这个偏好存到数据库里。下次你说“帮我订张机票”，它会自动选靠窗的位置。它甚至能记住你讨厌香菜、喜欢喝冰美式、每次订酒店都要有泳池。

这不就是一个真正了解你的私人助理吗？

那么，长期记忆到底是怎么实现的？这里就要介绍一个关键技术，叫RAG，中文是“检索增强生成”。名字有点拗口，但原理特别简单，我们打个比方就明白了。

想象你是一个学生，要写一篇关于“唐朝”的论文。如果你凭自己脑子里的死记硬背来写，可能只能写出李世民、李白、安史之乱这些大概，很片面。但是如果你手里有一本百科全书，你写一段就去查一下资料，那你的论文就会非常扎实、准确。

RAG干的正是这件事。当Agent收到你的问题后，它不会只靠自己的“大脑”硬答，而是先去一个外部的知识库或数据库里“检索”和问题最相关的内容，把这些内容作为参考资料，再结合自己的推理能力来生成回答。这个过程就像图书馆管理员：你问他“唐朝有什么著名诗人”，他不会凭记忆随口说，而是先去书架翻书，找到相关内容再告诉你。

在技术实现上，这个外部知识库通常不是普通的数据库，而是一个叫做向量数据库的东西。普通数据库存的是“关键词”，比如“香菜”这个词；而向量数据库存的是“语义”，也就是意思。它能理解“讨厌香菜”和“不爱吃那种绿色的草”本质上是同一件事。这样Agent在检索时就不会死板地只匹配关键词，而是能聪明地找到意思相近的内容。

举个例子。你告诉Agent“我不吃香菜”。过了几天你又说“这道菜能不能不放那种绿色的调味草？”Agent通过向量数据库一查，发现“绿色的调味草”和“香菜”在语义上非常接近，就能明白你还是在说同一件事。这就是向量数据库的妙处。

那么，短期记忆和长期记忆在实际中是怎么配合的呢？我们用一个完整的例子来说明。

假设你用OpenClaw规划一个五天的旅行。第一天，你跟它说：“我喜欢靠窗的座位，讨厌香菜，酒店最好有泳池。”OpenClaw的短期记忆记录下了这些信息，同时长期记忆把它存到了向量数据库里。第二天，你问它“帮我查一下去三亚的机票”，它会先检索长期记忆，发现“靠窗座位”的偏好，然后查询航空公司API时主动勾选靠窗。第三天，你说“推荐一家酒店”，它又检索长期记忆，发现“有泳池”的要求，只给你推带泳池的选项。第四天，你问“附近有什么好吃的餐厅”，它检索记忆，发现“讨厌香菜”，所以在推荐餐厅时会自动避开那些喜欢放香菜的菜系。

你看，整个过程中，短期记忆负责当前对话的连贯性，长期记忆负责跨时间的偏好存储，RAG负责从海量记忆里精准找到相关的内容。三者配合，让Agent看起来就像真的了解你、记得你。

当然，记忆功能也带来了新的问题——隐私。Agent记住了你那么多个人信息，这些数据存在哪里？谁来保护？你能不能删除？这些问题我们将来会专门讨论。

现在我们来总结一下今天的核心要点。

第一，Agent的记忆分为短期记忆和长期记忆。短期记忆取决于大模型的上下文窗口，只存在于当前对话中；长期记忆通过外部存储实现，可以跨对话、跨时间保留。

第二，RAG是实现长期记忆的关键技术。它让Agent在回答问题前先去外部知识库检索相关信息，再把检索结果作为参考来生成回答，避免了“死记硬背”和幻觉问题。

第三，向量数据库是RAG背后的支撑技术。它通过存储和检索语义向量，让Agent能够理解意思相近的表达，而不是死板匹配关键词。

第四，有了完整的记忆系统，Agent才能真正成为你的个性化助手——记住你的偏好、习惯、历史互动，在你需要的时候主动应用这些信息。

下一期，我们会继续聊Agent的另一个核心能力：规划。Agent怎么把一个复杂的任务拆解成一步步的小步骤？中途遇到意外怎么自我调整？我们下期见。

这里是《AI有点意思》，我是小艾。每周和你一起，用最轻松的方式，看懂最前沿的AI。下期再见。