136. 全球大模型季报第9集:和广密聊,Coding是AGI第二幕、硅谷御三家真相、模型正成为新一代OS张小珺Jùn|商业访谈录

136. 全球大模型季报第9集:和广密聊,Coding是AGI第二幕、硅谷御三家真相、模型正成为新一代OS

83分钟 ·
播放数72746
·
评论数238

今天给大家带来的是全球大模型季报第9集,这一集的情绪十分复杂。

一方面,你会看到正在急速进化的AI革命。Coding把AI从聊天机器人Chatbot第一幕,推向了能够干活的Agent第二幕。研究员们已经不再亲自写代码。广密带来的核心判断是,Coding是新的”AI加速器",正在加速AGI实现,领先的Coding模型就像领先的GPU。

另一方面,社会层面随之进入白领通缩与失业的窗口。整个社会准备好了应对这么剧烈变化的AI革命吗?

OUTLINE:

00:02:00 第9集季报的概览

00:03:28 硅谷体感与洞察

过去一个Q,智能水平进步幅度赶上2025全年,推背感非常强,AI奇点时刻应该很快就到

最关键转折点就是Opus 4.5 → Opus 4.6模型,算是GPT-3 → GPT-4跨代际提升的模型

今年6月之前可能还会再有一个从GPT-3→4水平幅度的跨越,OpenAI/Anthropic新模型都很强,Mythos/Spud下一代也开始训练了,继续加速

Coding会是头部的放大器,最顶尖1的人才能放大10-50倍的生产力

你是否相信Code可以表达数字世界的绝大多数任务?“语言即世界,代码即方案”

如果领先的模型公司不重视Coding,大概率会掉出第一梯队

Coding就像Amazon最早卖书一样,借助卖完书把所有仓储物流用户全都拉通了

Coding在整个AGI的历史进程中处在什么位置?

做好Coding的难点到底在哪里?不只是技术knowhow,更是战略组织和文化问题

00:22:10 硅谷御三家内部真实情况

00:22:10 Anthropic

All in Coding不是day1这个团队就想清楚的

创始人特别hands-on亲自看训练数据,重视数据和重视技术细节刻在基因里

偏好“underdog”而非大人物,文化面试非常严格,尤其是看重一个人的文化特质

00:33:35 OpenAI

在这个时代的过去胜利秘诀,可能是下个时代的毒药

过去OpenAI在ChatGPT的成功,让他们专注ToC忽视了Coding

重点说下OpenAI做的不好的地方,可以在构建组织的时候借鉴一下

OpenAI即将要发布的新模型,是真正意义上的GPT-5吧

00:47:13 Gemini

Gemini 3被高估

Coding严重落后,Google最大的战略失误

Google是最领先的追随者,资源和布局上没啥绝对短板,但战略跟随OpenAI/Anthropic,掉队可能性很低

00:54:16 Meta TBD

最有机会的挑战者,已经取代xAI,成为硅谷4号种子

00:58:07 xAI

xAI短期基本上掉队了,最大问题感觉也是战略摇摆

崩溃始于founding team逐渐离开

01:02:00 Harness Engineering

01:03:57 中国御三家

01:05:42 模型是新一代操作系统

01:07:01 潜在的社会影响,失业、通缩

01:14:36 硅谷新趋势和投资新思考

《全球大模型季报》系列追踪:

2023: 54. 口述全球大模型这一年:人类千亿科学豪赌与参差的中美景观

2024Q1: 64. 和广密聊AGI大基建时代:电+芯片=产出智能

2024Q2: 69. 口述全球大模型这半年:Perplexity突然火爆和尚未爆发的AI应用生态

2024Q3: 73. AGI范式大转移:和广密预言草莓、OpenAI o1和self-play RL|全球大模型季报4

2024Q4: 86. 大模型季报年终特辑:和广密预言LLM产品超越Google之路

2025Q1: 97. 25年Q1大模型季报:和广密聊当下最大非共识、AGI的主线与主峰

2025Q2-Q3: 112. 和广密聊大模型季报:分化与收敛、全家桶与垂直整合、L4体验与挖矿窗口

2025Q4: 127. 大模型季报跨年对谈:和广密预言一场AI War、两大联盟和第三个范式Online Learning

LINKS:

我们的播客在小宇宙Apple Podcast、Spotify等全音频平台播出;

我们的视频播客在Bilibili小红书、视频号、抖音等全视频平台播出;

如果你想服用文字版,请搜索我们工作室的公众号:语言即世界language is world。

DISCLAIMER: 本内容不作为投资建议。

CONTACT: xiaojunzhang@lisw.ai

Jump into the new world-and explore with us!😉

展开Show Notes
AI进展太快了,季报感觉和年报一样
陈戈诺:听你一说才有这种感觉,恍如隔世
HD4047p
HD4047p
2026.4.15
少聊了两个重要的问题:1. 中国模型离御三家的差距是缩小还是扩大了,以及在终局,开源模型是否能在90%的任务上胜任。2. 投资组合为什么只包含模型,而不是包括AI芯片在内的半导体产业。
Guangmi:1/ 仅说Q1,进步幅度都很大,但GAP在变大,主要是GPU问题,不好scale很大的模型; 2/ 不敢预测终局,变量太多; 3/ 二级主要逻辑是,Token需求指数级爆发,物理硬件(算力/存储/互联)跟不上,物理世界跟不上数字世界的指数级爆发
momo2mo:非常同意。因为有开源模型,再加上现在这么多 Harness Agent 的存在,必然会出现一种情况:我可以用市面上相对比较便宜的模型,就能够胜任 60%~70% 相对容易的任务。 这个时候,模型与模型之间就会陷入无休止的竞争,包括: 1. 闭源跟闭源的竞争 2. 闭源跟开源的竞争 以此来推论的话,投资更底层的云、芯片和能源应该是更优的选择。当然,对比云、芯片和能源来看,当前芯片似乎是那个卡脖子的环节。
10条回复
Ayano_83su
Ayano_83su
2026.4.15
33:11 最牛逼的AI Researcher都担心自己1-2年后没有工作了...
程序员也在担心自己1-2年后没有工作了
不爱吃面爱吃卤煮:1-2 年太久远了,都是当下了,20%-30% 裁员程序员都是少的,遇到过裁员 60% 的,还有所有前后端测试团队都裁,每个团队留一个人
康克由:1-2年太乐观了,现在的目标是活到下半年
8条回复
YnYnY
YnYnY
2026.4.16
其实回顾下嘉宾之前的言论,也都是事后诸葛亮😮‍💨大家都预测不到到底谁更强,变化太快了🤦‍♂️说不定,过个半年,Google 又杀回第一了
杰克船长嘿咻嘿咻:同意,交替前进
祖春山
祖春山
2026.4.15
16:13 语言即世界,代码即方案,智能体即?
Hung_tdit:语言即世界,代码即方案,智能体即行动!
刘芮麟的CoT:语言是世界的高压表征→代码是方案的高压表征 智能体不是表征,是使用表征的主体
10条回复
井然丶
井然丶
2026.4.15
太好了,是广密,我们有救了!/手动狗头
HD441242v
HD441242v
2026.4.17
模型最近一次质变是gpt5high,之后的gpt5.1codex则是把coding能力补上了。然后现在最强的coding模型是gpt5.4,openai从来没有落后过,包括跟opus对比。只要你需要真正要维护部署一个有一定规模的生产系统,那么你很快就会发现codex的能力比claude高出一个档次,claude在解决真正的疑难问题上大概只有o3水平。回过头来说谷歌,能看出来demis是真不想做coding,他宁可分配人去做多模态,做世界模型,做生物,做数学,也不想做coding,他觉得卷这东西浪费太多人力。这个我觉得挺好,所有模型卷同质化的东西才是药丸
HD267305o:是的,我也是一样的感觉,5.1早就出来了,感觉openai对coding这块也挺重视的,社区对5.1 xhigh的好评特别多,甚至有些人体感超过claude
kb34
kb34
2026.4.16
ai之后的世界看上去就是两拨人:
一小撮想要和“上帝”掰手腕,知识负担更重的人/
和一大群“惊恐的绵羊🐑”,哈哈😂
花生_HzN7:人造god了,地狱笑话
这集真的是绝望的一集
庄明浩:绝望到底往往就会出现希望
HD467976y:没啥绝望的,开开心心的用着,还觉得AI智商低
5条回复
晨煊-
晨煊-
2026.4.18
除了广密的季报,小珺以后也常请 Freda 回来聊聊吧。听了两万小时播客以后给我留下印象最深的最有水平的三位投资人恰恰是在硅谷的女性,张璐,Jenny和 Freda, 其他那些所谓成功的男性大佬也无非是混圈子,善于利用社会资源获得项目回报而已,真正对趋势有认知,并且能提前几年看准趋势的恰恰是这三位女性。小珺以后请他们来吧
random_path
random_path
2026.4.16
感谢广密和小珺每个季度给大家分享观察!不过有一点没想明白,其实 opus 4.5 去年 11 月就发了,但是似乎大家即便一直在跟硅谷一线 researcher 聊,也没有预见到 anthropic 今年出圈和 arr 垂直飙升的速度(去年 12 月当时主流话题还是在讨论 oai 和 goog)。似乎大家都是慢了一点要到 2 月 arr 出来以后,或者是稍早点 anthropic 击溃美国 saas 开始才意识到今年第一季度的主角。或者甚至可能 Dario 自己都没意识到(去年底今年初我记得 Dario 还在峰会上阴阳 sam 锁芯片产能是瞎搞,当成 YOLO,结果转头自己晚了两个季度,只能再加价 50%-100% 去找锁...)
Guangmi:是的,Dario都低估了需求,算力规划保守了,估计后面Token定价会涨价
HD389211u:是不是这一轮增长的主要驱动是4.6呢
庄明浩
庄明浩
2026.4.15
05:53 “挡不住了”
jaime-y:这加速论听着就吓人,像劝降的
天猪
天猪
2026.4.22
刚听完主播聊到 Cursor 适合被 xAI 收购, 就看到新闻:xAI 宣布一项颇为奇特的协议:要么以600亿美元收购 Cursor,要么支付100亿美元费用
黄唐hut:特地来找这个评论
aibiubiu
aibiubiu
2026.4.15
硅谷御三家讲了四十分钟,国内御三家不到四分钟,两边差距越来越大了😂😂
Guangmi:硅谷对大家有参考意义,主要目的是传递和拉齐一些认知。国内dynamics怕讲不清楚。
伸伸懒腰:glm5.1在coding上性能,已经在opus和Sonnet之间了(lmarena)。所以他家coding plan敢一直在大涨价
3条回复
锦鲤Mark
锦鲤Mark
2026.4.22
39:34 cursor还真卖给马斯克了
37:41 这句话不对,过去200年人类知识有积累,智商没进步
Amy琳琳
Amy琳琳
2026.4.18
还是那句话:“如果一个季度只收听一期关于全球大模型的播客,听这期就够了。”😃
我在吉隆坡,刚参加完一个 AI Coding 的平台宣讲会,非常认可接下来对于 AI Coding 的一些判断。
确实,针对高消耗 Token 的情况,平台可以给出更好的权益配套体系,并针对满足 AI Coding 项目者关于隐私性、安全性以及算法使用的优惠价等需求。
周粥粥_VD9y:19号凌晨1点13分,有100+和我一起在线听。
ca01ei
ca01ei
2026.4.17
1:15:23 “即便没有认知,但是像小扎一样有魄力.…”,小扎:“。。。🌚”
HD547481y:哈哈哈哈哈哈我听到这里也笑喷了
哼哈嘿呀
哼哈嘿呀
2026.4.15
最高频词汇:我不知道🥹
Can_aEVT:发现真正懂当下AI的,分为两派,要么否定当前的所谓的AI,要么夸大当下所谓的AI