三个月构建企业级AI记忆:踩坑实录

三个月构建企业级AI记忆:踩坑实录

23分钟 ·
播放数68
·
评论数1

【节目简介】

上期我们聊了林俊阳的"从Reasoning到Agentic Thinking",他说记忆层是Agent时代最重要的架构组件。

这期我们看一个真实案例——Momo团队三个月试了三种方法构建企业级AI记忆,全是血泪教训。

自下而上索引走红后翻车,自上而下提取不准确,最终从客户数据切入找到方向。

核心问题至今未解:

如何从非结构化数据中提取结构化记忆?

【时间线】

00:00 开场 · 关联上期林俊阳"记忆层最重要"

01:30 为什么AI记忆这么重要 · context window不是真正的记忆

03:00 方法一:自下而上输入索引 · 索引所有应用输入

05:00 走红→翻车:用户引导太重+见树不见林

06:30 知识图谱是过度设计?放弃回归pgvector

08:30 方法二:自上而下提取 · 先推断项目再填充细节

10:30 产品问题:设置耗时+token成本+用户问"然后呢"

12:00 技术问题:提取不准确 · Claude Code同样踩坑

14:00 方法三:从PostHog客户数据入手

15:30 自动客户画像+流失分析 · 先让用户看到价值

17:00 核心教训:非结构化→结构化的根本难题

19:00 单一SaaS记忆方案永远行不通 · 需要持续构建+人为反馈

20:30 Agent团队需要持久共享可查询的记忆

========================================

【核心观点】

· context window是短期记忆,真正的记忆是跨会话、持久、可查询的

· 自下而上能索引信号但无法重建团队思维模式——高层思维从未被明确记录

· 知识图谱在多跳查询场景下可能是过度设计,pgvector更实用

· 从非结构化数据提取结构化记忆是根本难题——所有方法都卡在这里

· Claude Code的CLAUDE.md就是不断压缩的md文件,说明记忆问题远未解决

· 先从垂直场景切入让用户看到价值,再扩展——通用记忆太难做

· Agent的瓶颈不是模型能力,而是记忆和环境

========================================

【关于一支烟花】

一支烟花是一个关注AI前沿动态的创作者社区

公众号:一支烟花AI

欢迎加入社群交流

展开Show Notes
Tristantanta
Tristantanta
2026.4.06
笔记: 自下而上的缺点这是见树不见林。
自下而上的构建,无法达成自上而下的理解。