S03E03-LLM底层揭秘

智能共生：MIT前沿AI课笔记

18分钟 ·2个月前

25

·

0

S03E03：LLM底层揭秘——Transformer与提示工程

播客简介

欢迎回到《AI深度漫谈》第三期！本期我们将潜入LLM的内部世界，去理解两个最核心的支柱：Transformer架构和提示工程。

如果把智能体比作一个机器人，那么LLM就是它的"中央处理器"加"知识库"。不了解这个"大脑"的架构和原理，我们很难真正理解智能体能力的边界在哪里，又该如何更好地使用它。

本期内容大纲

第一章：开场——从"猜词游戏"到"通用大脑"

语言模型的本质：一个"猜词游戏"

核心任务：给定已有文字，预测下一个最可能出现的词

技术升级之路：从简单游戏到智能体所需的"通用大脑"

第二章：语言模型演进——从"死记硬背"到"理解关联"

N-gram模型：死记硬背的"学生"
固定窗口、无法泛化、缺乏语义理解

RNN/LSTM升级：引入"词向量"和"记忆"
词向量：给每个词分配"身份证坐标"
隐藏状态：不断流淌的"记忆河流"
瓶颈：串行计算慢、长距离信息模糊

第三章：Transformer革命——并行化的"注意力"艺术

范式转换：从"顺序思考"到"全局审视"

自注意力机制：模拟阅读时的"视线跳跃"
Query、Key、Value三把"钥匙"
多头注意力：多位专家从不同角度分析

并行计算优势：充分利用GPU大规模训练

位置编码：给词语发"座位号"，感知顺序关系

Decoder-Only架构：GPT、Llama等模型的基础

第四章：缩放法则与"涌现"的魔法

缩放法则：性能与参数、数据、计算量的幂律关系

Chinchilla定律：参数量与数据量的最优配比

能力涌现：思维链推理、上下文学习等突然展现的新能力

对智能体的意义：规划能力和工具学习功能的基石

第五章：与"大脑"对话的艺术——提示工程

三种经典方法：
零样本提示：直接下指令
单样本提示：给一个示范
少样本提示：给多个示例

思维链技巧：引导模型"一步步思考"

采样参数：
Temperature（温度）：控制随机性
Top-p：控制候选词范围

系统提示词：智能体的"核心人格设定"

第六章：模型选型——如何为你的智能体挑选"大脑"

闭源模型（GPT、Claude、Gemini）：开箱即用、性能强大

开源模型（Llama、Mistral、通义千问）：透明可控、私有化部署

选型建议：快速原型用闭源API，产品化考虑开源或混合方案

第七章：清醒认识"大脑"的局限性

幻觉：自信地生成不符合事实的信息

知识截止性：对训练数据之后的新事件一无所知

偏见问题：继承训练数据中的社会文化偏见

应对方法：RAG、工具调用、多步推理、明确责任边界

第八章：总结展望——理论与实践的闭环

三层认知：
理解Transformer的自注意力机制
理解提示工程是交互界面
清醒认识局限性，用系统设计弥补不足

适合人群

想了解LLM底层原理的技术人员

希望更好使用智能体的开发者

对Transformer和提示工程感兴趣的AI学习者

你将收获

理解Transformer架构的核心原理（自注意力、位置编码、并行计算）

掌握提示工程的基本技巧和高级方法

学会为智能体项目选择合适的LLM

清醒认识LLM的局限性及应对策略

关键词

Transformer、自注意力、多头注意力、位置编码、Decoder-Only、缩放法则、能力涌现、提示工程、思维链、Temperature、幻觉、RAG

在小宇宙打开