【第23期】AI终于有了记忆，却很快患上了长期失忆症。
这一期我们从Elman网络讲起：为什么只是把“计算结果”换成“隐藏状态”，就让机器第一次在预测下一个词的过程中，自己发现了语法结构？而本吉奥又为什么在1994年指出，简单RNN存在一个残酷矛盾：记得住和学得会，两者不可兼得？
这期是理解RNN、LSTM，以及后来大语言模型的一块关键拼图。
* [00:00:15] 回顾 Jordan 与 Elman 网络的开山地位及其结构差异。
* [00:00:45] 深度类比：为什么“电影好不好看”只是结果，而脑中的“复杂感受”才是灵魂。
* [00:01:35] 揭秘“隐藏状态”：为什么语境判断比上一步的输出更重要？
* [00:02:05] 认知科学家的执着：埃尔曼对乔姆斯基“天赋论”的怀疑与挑战。
* [00:02:35] 迷你的“语言世界”实验：29 个单词与 1 万个句子的奇妙训练。
* [00:03:46] 神奇的涌现：AI 如何在无监督下自行长出一棵“层级分类树”。
* [00:04:42] 跨越 40 年的共鸣：Elman 网络作为大语言模型（LLM）早期微光的意义。
* [00:05:05] 总结：预测序列、在错误中学习与结构的自发形成。

SHARE

COMMENT

VOICE_COMMENT

COMMENT_PAGE

CLAP

PICK

VOTE

AI_SUMMARIZE

从今天开始，我希望能以每周或每两周一期左右的频率，来做一个AI工程科普的系列。

起因是这样的，我从事AI相关的工作超过20年了，两三个月前，也就是2025年4月份，一位知名出版社的编辑建议我写一本AI科普书。我当然有自知之明，又不什么学术大家，写不了学术著作，但是说到科普，我很愿意尝试一下。



这会是这是一本什么样的书？

首先，我希望是一本“故事驱动”的书。在我看来，技术的演进并非一连串冰冷算法的迭代，而是一群鲜活的、天才的、甚至偏执的人，在一次次思想碰撞、路线之争、乃至人生沉浮中推动的。

其次，我希望这是一张“能看懂的地图”。我们不会回避硬核的技术，但我们会尽最大努力，把它们拆解成一个个更小的、更容易理解的模块。我们会聚焦于这些技术“为什么会出现”、“解决了什么关键问题”，而不是陷入它们内部复杂的数学细节。



你可能会问，写书就写书，怎么今天就开始整播客了？辛苦写书倒不怕，我担心的是写完了才发现这不是你需要的。所以打算一边写书，一边基于书的内容做一个AI科普的系列短视频和播客，对我来说这是分享，是梳理，更是一次学习和交流的机会。



准备好了吗？那就让我们一起启程吧。

AI_SUMMARIZE_EPISODE

白话-大模型

第23期丨RNN的长期失忆症

68b2bfeef87f03c8b86cb448/lhHr_WHQM1R23ntSgKuK1aoXFL6c.m4a