EP74：Andrej Karpathy前瞻性LLM知识库分享-终于把「AI 时代知识管理」的原型说清楚了！

Andrej Karpathy终于把「AI 时代知识管理」的原型说清楚了，原文《LLM Knowledge Bases》

核心不是 RAG，不是更聪明的搜索，而是让 LLM 成为知识库的唯一维护者——采集、编译、输出、linting、自我修复，全部自动化。

人只负责两件事：投喂原料，和提出好问题。这中间的 gap，就是他说的 incredible new product。

具体复现步骤：

把你所有觉得有价值的东西无脑丢进去：网页、论文、截图、PDF、GitHub repo、播客转录。不需要分类，不要提前建文件夹。

Andrej Karpathy现在用的是 Obsidian Web Clipper 一键剪藏，连图片一起下载到本地。

给 LLM 的核心指令只有两句话：「阅读 raw/ 里的所有文件，生成一个结构化的 wiki。要求：每份原始文件一篇摘要，提取概念并写成独立文章，然后互相做 backlink。」放心丢过去，最新 LLM 的 wiki 结构能力比人类强。

不要拿 Obsidian 写笔记，拿它当前端看板。

raw/ 是原始数据，wiki/ 是 LLM 编译后的产物，output/ 是你的查询结果。三个目录，天然的分层。

你的知识库大了之后，提问方式要变。

不要问「这篇文章说了什么」，要问：「帮我对比 A 和 B 的差异，所有结论必须引用 wiki 原文并标注来源。」

然后让 LLM 不直接回答你——让它生成一份 .md 报告，或者 Marp 幻灯片，或者 matplotlib 图表。

任何一次查询的结果，都必须重新存回 wiki。

这样你的每次探索都会沉淀下来，知识库只会越查越厚。

给 LLM 的指令：「通读整个 wiki，找出： 1. 互相矛盾的数据 2. 缺失的中间环节 3. 可以写新文章的概念关联」

这是 human 做不到、LLM 很擅长的维护工作。

**📺播客说明**

本播客采用虚拟主持人进行播客翻译的音频制作，因此有可能会有一些地方听起来怪怪的。如想了解更多信息，请关注微信公众号"西经东译"获取AI最新资讯。如有后续想要听的其他外文播客，也欢迎联系微信：mayday2303。