大家好,欢迎回到《AI有点意思》。我是小艾。
前两期我们聊了Agent的定义和它的“工具箱”。这一期,我们来聊一个每个人都关心的话题——记忆力。
你有没有遇到过这种情况:跟某个AI聊了半天旅行计划,你告诉它你喜欢靠窗的座位、讨厌香菜、还想住有泳池的酒店。结果三天后你再来找它,问“帮我订机票吧”,它一脸茫然地问你:“您对座位有什么偏好吗?您有什么忌口吗?”
这时候你心里只有一个字:累。
为什么AI会这么健忘?其实不是它故意气你,而是因为大多数AI大模型天生就有一个短板——记忆是“短时”的。
今天我们就来拆解Agent的记忆系统,看看它到底能记住多少、能记多久,以及最新的技术怎么让Agent拥有“过目不忘”的本领。
我们先从两个概念说起:短期记忆和长期记忆。
短期记忆,在技术里叫“上下文窗口”。你可以把它想象成AI的一张临时便签纸。你和AI聊天时,它会把你们最近说的话写在这张便签上,然后根据便签上的内容来回答你。这张便签是有大小限制的——早期的模型只能记住几千个词,现在顶级的模型可以记住几十万甚至一百万个词。但不管多大,它终究是临时的。一旦对话结束或者便签被新的内容覆盖,旧的信息就消失了。
这就是为什么普通AI聊天机器人会“失忆”。你和它聊了半小时,它好像都记得,但关掉页面重新打开,它什么都忘了。因为它只有短期记忆,没有长期记忆。
那长期记忆是什么呢?它就像AI的一个“外接硬盘”。重要的信息、用户的偏好、历史对话的关键点,都会被存到外部数据库里。下次你和Agent对话时,它会主动去硬盘里翻一翻:“我上次和这位用户聊过什么?他喜欢什么?讨厌什么?”然后再结合当前的短期记忆,给出更贴心的回答。
现在很多先进的Agent,比如我们上期提到的OpenClaw,就内置了这种长期记忆功能。你可以告诉它“我喜欢靠窗的座位”,它会把这个偏好存到数据库里。下次你说“帮我订张机票”,它会自动选靠窗的位置。它甚至能记住你讨厌香菜、喜欢喝冰美式、每次订酒店都要有泳池。
这不就是一个真正了解你的私人助理吗?
那么,长期记忆到底是怎么实现的?这里就要介绍一个关键技术,叫RAG,中文是“检索增强生成”。名字有点拗口,但原理特别简单,我们打个比方就明白了。
想象你是一个学生,要写一篇关于“唐朝”的论文。如果你凭自己脑子里的死记硬背来写,可能只能写出李世民、李白、安史之乱这些大概,很片面。但是如果你手里有一本百科全书,你写一段就去查一下资料,那你的论文就会非常扎实、准确。
RAG干的正是这件事。当Agent收到你的问题后,它不会只靠自己的“大脑”硬答,而是先去一个外部的知识库或数据库里“检索”和问题最相关的内容,把这些内容作为参考资料,再结合自己的推理能力来生成回答。这个过程就像图书馆管理员:你问他“唐朝有什么著名诗人”,他不会凭记忆随口说,而是先去书架翻书,找到相关内容再告诉你。
在技术实现上,这个外部知识库通常不是普通的数据库,而是一个叫做向量数据库的东西。普通数据库存的是“关键词”,比如“香菜”这个词;而向量数据库存的是“语义”,也就是意思。它能理解“讨厌香菜”和“不爱吃那种绿色的草”本质上是同一件事。这样Agent在检索时就不会死板地只匹配关键词,而是能聪明地找到意思相近的内容。
举个例子。你告诉Agent“我不吃香菜”。过了几天你又说“这道菜能不能不放那种绿色的调味草?”Agent通过向量数据库一查,发现“绿色的调味草”和“香菜”在语义上非常接近,就能明白你还是在说同一件事。这就是向量数据库的妙处。
那么,短期记忆和长期记忆在实际中是怎么配合的呢?我们用一个完整的例子来说明。
假设你用OpenClaw规划一个五天的旅行。第一天,你跟它说:“我喜欢靠窗的座位,讨厌香菜,酒店最好有泳池。”OpenClaw的短期记忆记录下了这些信息,同时长期记忆把它存到了向量数据库里。第二天,你问它“帮我查一下去三亚的机票”,它会先检索长期记忆,发现“靠窗座位”的偏好,然后查询航空公司API时主动勾选靠窗。第三天,你说“推荐一家酒店”,它又检索长期记忆,发现“有泳池”的要求,只给你推带泳池的选项。第四天,你问“附近有什么好吃的餐厅”,它检索记忆,发现“讨厌香菜”,所以在推荐餐厅时会自动避开那些喜欢放香菜的菜系。
你看,整个过程中,短期记忆负责当前对话的连贯性,长期记忆负责跨时间的偏好存储,RAG负责从海量记忆里精准找到相关的内容。三者配合,让Agent看起来就像真的了解你、记得你。
当然,记忆功能也带来了新的问题——隐私。Agent记住了你那么多个人信息,这些数据存在哪里?谁来保护?你能不能删除?这些问题我们将来会专门讨论。
现在我们来总结一下今天的核心要点。
第一,Agent的记忆分为短期记忆和长期记忆。短期记忆取决于大模型的上下文窗口,只存在于当前对话中;长期记忆通过外部存储实现,可以跨对话、跨时间保留。
第二,RAG是实现长期记忆的关键技术。它让Agent在回答问题前先去外部知识库检索相关信息,再把检索结果作为参考来生成回答,避免了“死记硬背”和幻觉问题。
第三,向量数据库是RAG背后的支撑技术。它通过存储和检索语义向量,让Agent能够理解意思相近的表达,而不是死板匹配关键词。
第四,有了完整的记忆系统,Agent才能真正成为你的个性化助手——记住你的偏好、习惯、历史互动,在你需要的时候主动应用这些信息。
下一期,我们会继续聊Agent的另一个核心能力:规划。Agent怎么把一个复杂的任务拆解成一步步的小步骤?中途遇到意外怎么自我调整?我们下期见。
这里是《AI有点意思》,我是小艾。每周和你一起,用最轻松的方式,看懂最前沿的AI。下期再见。
