136. 全球大模型季报第9集:和广密聊,Coding是AGI第二幕、硅谷御三家真相、模型正成为新一代OS张小珺Jùn|商业访谈录

136. 全球大模型季报第9集:和广密聊,Coding是AGI第二幕、硅谷御三家真相、模型正成为新一代OS

83分钟 ·
播放数6417
·
评论数55

今天给大家带来的是全球大模型季报第9集,这一集的情绪十分复杂。

一方面,你会看到正在急速进化的AI革命。Coding把AI从聊天机器人Chatbot第一幕,推向了能够干活的Agent第二幕。研究员们已经不再亲自写代码。广密带来的核心判断是,Coding是新的”AI加速器",正在加速AGI实现,领先的Coding模型就像领先的GPU。

另一方面,社会层面随之进入白领通缩与失业的窗口。整个社会准备好了应对这么剧烈变化的AI革命吗?

OUTLINE:

00:02:00 第9集季报的概览

00:03:28 硅谷体感与洞察

过去一个Q,智能水平进步幅度赶上2025全年,推背感非常强,AI奇点时刻应该很快就到

最关键转折点就是Opus 4.5 → Opus 4.6模型,算是GPT-3 → GPT-4跨代际提升的模型

今年6月之前可能还会再有一个从GPT-3→4水平幅度的跨越,OpenAI/Anthropic新模型都很强,Mythos/Spud下一代也开始训练了,继续加速

Coding会是头部的放大器,最顶尖1的人才能放大10-50倍的生产力

你是否相信Code可以表达数字世界的绝大多数任务?“语言即世界,代码即方案”

如果领先的模型公司不重视Coding,大概率会掉出第一梯队

Coding就像Amazon最早卖书一样,借助卖完书把所有仓储物流用户全都拉通了

Coding在整个AGI的历史进程中处在什么位置?

做好Coding的难点到底在哪里?不只是技术knowhow,更是战略组织和文化问题

00:22:10 硅谷御三家内部真实情况

00:22:10 Anthropic

All in Coding不是day1这个团队就想清楚的

创始人特别hands-on亲自看训练数据,重视数据和重视技术细节刻在基因里

偏好“underdog”而非大人物,文化面试非常严格,尤其是看重一个人的文化特质

00:33:35 OpenAI

在这个时代的过去胜利秘诀,可能是下个时代的毒药

过去OpenAI在ChatGPT的成功,让他们专注ToC忽视了Coding

重点说下OpenAI做的不好的地方,可以在构建组织的时候借鉴一下

OpenAI即将要发布的新模型,是真正意义上的GPT-5吧

00:47:13 Gemini

Gemini 3被高估

Coding严重落后,Google最大的战略失误

Google是最领先的追随者,资源和布局上没啥绝对短板,但战略跟随OpenAI/Anthropic,掉队可能性很低

00:54:16 Meta TBD

最有机会的挑战者,已经取代xAI,成为硅谷4号种子

00:58:07 xAI

xAI短期基本上掉队了,最大问题感觉也是战略摇摆

崩溃始于founding team逐渐离开

01:02:00 Harness Engineering

01:03:57 中国御三家

01:05:42 模型是新一代操作系统

01:07:01 潜在的社会影响,失业、通缩

01:14:36 硅谷新趋势和投资新思考

《全球大模型季报》系列追踪:

2023: 54. 口述全球大模型这一年:人类千亿科学豪赌与参差的中美景观

2024Q1: 64. 和广密聊AGI大基建时代:电+芯片=产出智能

2024Q2: 69. 口述全球大模型这半年:Perplexity突然火爆和尚未爆发的AI应用生态

2024Q3: 73. AGI范式大转移:和广密预言草莓、OpenAI o1和self-play RL|全球大模型季报4

2024Q4: 86. 大模型季报年终特辑:和广密预言LLM产品超越Google之路

2025Q1: 97. 25年Q1大模型季报:和广密聊当下最大非共识、AGI的主线与主峰

2025Q2-Q3: 112. 和广密聊大模型季报:分化与收敛、全家桶与垂直整合、L4体验与挖矿窗口

2025Q4: 127. 大模型季报跨年对谈:和广密预言一场AI War、两大联盟和第三个范式Online Learning

LINKS:

我们的播客在小宇宙Apple Podcast、Spotify等全音频平台播出;

我们的视频播客在Bilibili小红书、视频号、抖音等全视频平台播出;

如果你想服用文字版,请搜索我们工作室的公众号:语言即世界language is world。

DISCLAIMER: 本内容不作为投资建议。

CONTACT: xiaojunzhang@lisw.ai

Jump into the new world-and explore with us!😉

展开Show Notes
祖春山
祖春山
9小时前
16:13 语言即世界,代码即方案,智能体即?
Hung_tdit:语言即世界,代码即方案,智能体即行动!
伸伸懒腰:human提需求和最终把关,agent负责计划实现验证
井然丶
井然丶
10小时前
太好了,是广密,我们有救了!/手动狗头
Ayano_83su
Ayano_83su
9小时前
33:11 最牛逼的AI Researcher都担心自己1-2年后没有工作了...
程序员也在担心自己1-2年后没有工作了
不爱吃面爱吃卤煮:1-2 年太久远了,都是当下了,20%-30% 裁员程序员都是少的,遇到过裁员 60% 的,还有所有前后端测试团队都裁,每个团队留一个人
庄明浩
庄明浩
9小时前
05:53 “挡不住了”
jaime-y:这加速论听着就吓人,像劝降的
欢喜HD
欢喜HD
9小时前
有幸见证这次浪潮,强如广密这次更多也说了很多次不知道,都很乐观,“5050”等
来了,老李别走了,常驻吧
Kaitrine:+1
魔都侦探
魔都侦探
9小时前
AI进展太快了,季报感觉和年报一样
aibiubiu
aibiubiu
9小时前
硅谷御三家讲了四十分钟,国内御三家不到四分钟,两边差距越来越大了😂😂
伸伸懒腰:glm5.1在coding上性能,已经在opus和Sonnet之间了(lmarena)。所以他家coding plan敢一直在大涨价
02:01 小珺和广密这期开头就很精彩,我将逐字学习:)
Elfsong
Elfsong
5小时前
这期的广密真不错
林-哈哈
林-哈哈
7小时前
01:23 前面的这个高光混剪停顿有点怪怪的,就类似这句,“不重视编程,那大概率(停顿)会掉出第一梯队”第一次听成“不会掉出第一梯队”
Yizhengw
Yizhengw
10小时前
一分钟前!
Jie_s
Jie_s
7小时前
17:15 这部分提到的Coding,就理解为代码或者编程的意思嘛?
伸伸懒腰:对,但是现在万物都可以让agent+skill+coding实现。比如用cc调用Figma
宇小宙ghk
宇小宙ghk
8小时前
30:36 求证一下opus4.6据说是4t参数量的dense?
jaime-y:4Tdense 夸张了点吧
宇小宙ghk:sonnet 1t,opus 5t,是不是dense不清楚,要不他那么贵呢…
宇小宙ghk
宇小宙ghk
8小时前
09:59 如果a家不反华,以中国的用量贡献,在现在这个窗口期里,就足够它把openai远远甩开了
sanbai_:现在的增量里面应该有不少实际是来自中国的。至少国内互联网公司内部应该都用上了。
本末电碳
本末电碳
2分钟前
广密 清晰的分析 优秀的见解 感谢两位
Maregan
Maregan
35分钟前
听爽了
backdoor705
backdoor705
1 小时前
35:49 绝大多数人的智力没有模型高了
伸伸懒腰
伸伸懒腰
1 小时前
但是anthropic还是做了是普通人互动更友好的cowork
伸伸懒腰
伸伸懒腰
2小时前
11:12 万物皆可用coding来实现,毕竟code本质是人类和机器互动的语言