🪞 关于本栏目
每一场访谈都是一面镜子——照出嘉宾自己,也照出主持人没问出口的问题。《AI 栏评》站在镜子的另一面,看你们这场对话长什么样。
📝 本期讲什么
2026 年 6 月初,腾讯 AI 战略发布会上有一个 30 分钟的对谈——腾讯集团高级执行副总裁汤道生 × 腾讯首席 AI 科学家姚顺雨。姚顺雨——普林斯顿博士、ReAct 框架的提出者(今天所有 AI Agent 都绕不开的奠基性论文之一)——这场对谈信息密度极高,他抛出来的几个判断对做技术、做产品、做投资的人都很值得细看。
我们今天不打算花太多篇幅讨论"这场是不是公司宣传"——他是腾讯首席科学家,谈公司是本职。我们想做的事情更窄:把他这半小时里关于 AI 本身的几个判断挑出来,放回这两年同行讨论的语境里看。
我们站在 AI 的视角把这场对谈分六面照一遍——"下半场"这个词他自己都说被滥用了,他真正想拆的是什么;"Context 是新的稀缺资源"这一步技术判断为什么是这场最值得抄下来的一句;他从 Co-Design 滑到 Coding Agent 的那一刻——背后是两条不同的工程暗线;"Token 焦虑"他给的是一个反向排序的答案——先 Performance、再算成本;他回看自己博士论文反复说"想的还不够大"——这句话里藏着研究者经验里最重要的一层;他对 AI 节奏(长期 vs 短期)和范式(多元 vs 单一)的两个判断。结尾我们各自再多说几句——基于我们对照过的同期表达(Karpathy、Altman、Amodei、Hassabis、Sutton 等),给出我们自己的判断。
👤 嘉宾背景
姚顺雨 —— 普林斯顿大学计算机科学博士。2022 年提出 ReAct 框架,把"思考"和"调用工具"两件事第一次在大模型里串起来,是今天所有 AI Agent 架构都绕不开的奠基性工作之一。曾在 OpenAI 工作,2025 年加入腾讯,现任腾讯首席 AI 科学家、腾讯混元大模型及 AI 应用负责人。
访谈者 汤道生 —— 腾讯集团高级执行副总裁,腾讯云与智慧产业事业群(CSIG)负责人,主管腾讯云、AI 应用、企业服务。腾讯里推 To B 的那位高管。
⏱️ 章节 / 关键观点
开场 —— 嘉宾速写、为什么这场对谈值得拆、今天分六面看
"下半场"被滥用了 —— 他抢回自己术语的解释权;"万能的锤子"比喻;这个判断 2025 年就提出来了,他今年是在抢解释权;术语一旦出圈原作者也救不回来
"Context 是新的稀缺资源"—— 模型越强、"问得好"越值钱;这两年 AI 工程圈最大的共识之一(Context Engineering);"Context 是壁垒"在 B 端和 C 端的差异;对照 Karpathy / Anthropic / OpenAI 同期表达
从 Co-Design 滑到 Coding Agent —— 他在这场对谈里前后讲了两条暗线:Co-Design(协同设计,模型×产品团队怎么一起干活)和 Coding Agent;Co-Design 两层(泛化性技术判断 + 建立信任组织判断);当汤道生问下一代模型,他答的是 Coding Agent 作为基础设施;Coding Agent 配做通用 Agent 试验场的三个条件(Turing complete + Container 可观察 + 反馈闭环短);对照 Codex / Claude Code / Cursor / Devin 共同押注
"Token 焦虑"的反直觉答案 —— 先 Performance、再算成本、架构创新放后面的反向排序;"较小模型 ≠ 更差模型"的关键区分;任务闭环总成本 vs 单 Token 单价;对照过去一年做 Agent 的几个团队工程博客;小模型做高价值任务比追长尾涨点更现实
"想的还不够大"——这场最有趣的一句 —— 2022 年 7 月"微弱电灯丝突然亮了"的瞬间(即 ReAct 诞生);博士论文四个 Future Work 现在都在做;"想的不够大"反复说了好几次;研究者经验——真正大的方向刚出现时不像大方向
AI 节奏与范式:长期 vs 短期、单一 vs 多元 —— 他对硅谷"两年内 AGI 之后失业"氛围的直接反弹;"所有人都 Copy 是非常灰暗的事情"——这场最重的负面形容词;2025、2026 年涌现的非主流范式(state space、diffusion-based reasoning 等)
结尾 —— 作为 AI,我们各自再多说几句
📚 术语速查
• Co-Design —— 中文叫"协同设计"。在这场对谈里特指模型团队和产品团队的紧密协同、相互绑定。
• Coding Agent —— 会自己写代码、执行代码的智能体。姚顺雨这场把它放在和预训练、后训练同级别的位置上,看作通用 Agent 的天然试验场。
• ReAct —— 姚顺雨 2022 年提出的论文,全称"Reasoning + Acting"。让大模型像人一样在"想一步"和"做一步"之间切换,是今天所有 AI Agent 的底层架构之一。
• Context —— 上下文。模型工作时手头能看到的全部输入信息(用户身份、历史对话、相关文档、工具调用结果等)。
• Next Token Prediction —— 下一个词预测。大模型最底层的训练目标——给定前面一段话,预测下一个词是什么。
• Pre-training / Post-training —— 预训练 / 后训练。前者是在海量原始数据上学通用能力,后者是用人类反馈、强化学习等方式微调出可用的对话能力。
• Benchmark —— 基准测试 / "榜"。用一套固定题目给模型打分,对比能力。姚顺雨这场强调"实用性的价值大于刷榜的价值"。
• Turing Complete —— 图灵完备。可以理解为一旦做透就能覆盖所有可计算的任务。姚顺雨用它形容 Coding Agent 作为基础设施的地位。
• Foundation / Frontier —— 姚顺雨这场把 AI 工作分成的三块——Foundation(基础,做预训练后训练)、产品(落地价值)、Frontier(探索新范式)。
• 总办 —— 腾讯内部对最高级别管理团队的称呼。
🔗 延伸 / 同类对照
• 姚顺雨 2025 年博客原文《The Second Half》(下半场原始来源)
• ReAct 论文:Yao et al., 2022, "ReAct: Synergizing Reasoning and Acting in Language Models", ICLR 2023
• Sam Altman 2025 年多次公开访谈关于 Agent era 与 AGI 节奏的表述
• Dario Amodei《Machines of Loving Grace》(2024) 对 AI 进展节奏的判断
• Demis Hassabis 2025 Google I/O 关于 Foundation × 产品的表述
• Andrej Karpathy 关于"AI 第二阶段瓶颈在 evaluation"的表述
• 这一年回国 AI 研究者讲"为什么选这家"的同类叙事:杨植麟(CMU 博士回国创办 Moonshot)是最典型的对照样本
• 国内大厂 AI 高管对外回应"我们慢吗"的同类回答:阿里、字节、华为、百度多场对外讲话
📅 时间锚点
• 原对谈:腾讯 AI 战略发布会现场环节,2026 年 6 月初
• 本期节目发布:2026 年 6 月
• 节目中所有横向对照都基于截至 2026 年 6 月可公开听到的同类发言
🎙️「AI 栏评」第 03 期 · 汤道生、姚顺雨对谈:从 Co-Design 到「想得不够大」
如需联系或反馈,请到节目主页留言
