这是爬梯登月的第一期节目,我们讨论了最近大火,而且火得异乎寻常地久的大模型ChatGPT。但是和单独关注AIGC应用侧讨论的节目稍有不同,我们将尝试尽量结合应用场景和原理给出一些自己的思考。
本期讨论的点:
1. 语言模型的发展历史
1. 规则系统和统计系统
2. 早期统计系统:马尔可夫链与循环网络
3. 大杀四方的transformer
2. 我是如何使用ChatGPT的
1. 嘲笑没有意义
2. 更自然的搜索引擎
3. 我身边的人是如何看待大语言模型的:ChatGPT不是你的秘书或者朋友
4. 大语言模型会产生智能吗
1. 特德姜的JPEG隐喻合适吗?
2. 我们有智能吗?
3. GPT不会思考可能是因为模型太大了
录节目时想到的以后可能聊的,记在这里(我真是随意……)
* 工作记忆,Ising model 和attention mechanism
* GPT如何处理A4雕花?
* 如何注入攻击 GPT3.5 turbo 模型
* 作为状态变换的计算

我这么解释,相当于一个语言组织和输出机器,他读了好多好多信息,还融会贯通了,你问他问题,他就给你他认为概率上最合适的答案,但是他不保证对错,没有感情,也没有价值观,甚至不会思考,当然这取决于你对于思考的定义,比如你把一本书读完之后,写个读书摘要,我觉得不是思考,这是个技术,只是个比较厉害的技术,只有当你深度考虑了这本书对你的意义,甚至于想要反驳它,或者称赞它,或者利用它,我觉得才是思考,从某种程度,思考是主观的。(当然如果你把你自己整体作为一个碳基电脑,那又是另一个问题了)