EP74:Andrej Karpathy前瞻性LLM知识库分享-终于把「AI 时代知识管理」的原型说清楚了!AI西经东译

EP74:Andrej Karpathy前瞻性LLM知识库分享-终于把「AI 时代知识管理」的原型说清楚了!

19分钟 ·
播放数420
·
评论数1

Andrej Karpathy终于把「AI 时代知识管理」的原型说清楚了,原文《LLM Knowledge Bases》

核心不是 RAG,不是更聪明的搜索,而是让 LLM 成为知识库的唯一维护者——采集、编译、输出、linting、自我修复,全部自动化。 

人只负责两件事:投喂原料,和提出好问题。  这中间的 gap,就是他说的 incredible new product。

具体复现步骤:

  • 第一步:建一个「垃圾场」 raw/ 

把你所有觉得有价值的东西无脑丢进去:网页、论文、截图、PDF、GitHub repo、播客转录。 不需要分类,不要提前建文件夹。

Andrej Karpathy现在用的是 Obsidian Web Clipper 一键剪藏,连图片一起下载到本地。

  • 第二步:让 LLM 当图书管理员

给 LLM 的核心指令只有两句话:  「阅读 raw/ 里的所有文件,生成一个结构化的 wiki。要求:每份原始文件一篇摘要,提取概念并写成独立文章,然后互相做 backlink。」 放心丢过去,最新 LLM 的 wiki 结构能力比人类强。  

  • 第三步:把 Obsidian 当 IDE 用

不要拿 Obsidian 写笔记,拿它当前端看板。 

raw/ 是原始数据,wiki/ 是 LLM 编译后的产物,output/ 是你的查询结果。  三个目录,天然的分层。  

  • 第四步:开始「对话式」研究

你的知识库大了之后,提问方式要变。

不要问「这篇文章说了什么」,要问:「帮我对比 A 和 B 的差异,所有结论必须引用 wiki 原文并标注来源。」 

然后让 LLM 不直接回答你——让它生成一份 .md 报告,或者 Marp 幻灯片,或者 matplotlib 图表。  

  • 第五步:强制回流(最关键的一步) 

任何一次查询的结果,都必须重新存回 wiki。  

这样你的每次探索都会沉淀下来,知识库只会越查越厚。  

  • 第六步:定期让 LLM lint 你的 wiki 

给 LLM 的指令:「通读整个 wiki,找出:  1. 互相矛盾的数据  2. 缺失的中间环节  3. 可以写新文章的概念关联」 

这是 human 做不到、LLM 很擅长的维护工作。

**📺播客说明**

本播客采用虚拟主持人进行播客翻译的音频制作,因此有可能会有一些地方听起来怪怪的。如想了解更多信息,请关注微信公众号"西经东译"获取AI最新资讯。如有后续想要听的其他外文播客,也欢迎联系微信:mayday2303。

展开Show Notes
00:12 我没有