113. 和杨植麟时隔1年的对话:K2、Agentic LLM、缸中之脑和“站在无限的开端”张小珺Jùn|商业访谈录

113. 和杨植麟时隔1年的对话:K2、Agentic LLM、缸中之脑和“站在无限的开端”

101分钟 ·
播放数48509
·
评论数107

今天的嘉宾是月之暗面创始人兼CEO杨植麟,距离他上一次来我们的节目(《商业访谈录》59集)已经过去1年半。

就在刚刚过去的7月,Kimi K2模型发布,引发了比较广泛的关注。K2是一个基于MoE架构的开源编程和Agentic大语言模型。形象来说,模型借助编程能力走出封闭的“缸中之脑”,长出了“手”,开始操控外部数字世界。

今天这集节目我和杨植麟聊了聊K2的研发和他当下的技术认知、技术判断。

以及,在过去一年的舆论风暴与创业起伏中,作为创始人,他的心情与思考。

01:49 一座无限的山

这有点像我最近在看的一本书:The Beginning of Infinity(无穷的开始)

也许有一天会发现,这座雪山没有尽头,我希望它一直没有尽头

但它还是一个“缸中之脑”:想象一个鱼缸,你把一个脑子放在里面,跟外界没有联系

不管是基于长思考的强化学习,还是Agent的强化学习,都指向同一个东西:test-time scaling(测试时扩展)

还有一个很有意思的趋势是,现在有更多模型公司去做“一方的Agent产品”

L1到L5不一定是串行关系,Claude就bet这一点:它在Reasoning上做得不是特别多,但在Agent上做得非常好

只有当模型参与到开发过程,才能解锁真正的Innovator(L4)阶段

24:58 K2是乔戈里峰

K2的重点有几个:一,我们希望它是一个非常好的基础模型

我们希望能最大化使用每一份数据,就是所谓token efficiency——喂一样多的数据,“脑子”长得更多

我们会对数据做很多Rephrase(改写)操作

我们很关注Muon优化器,它对token efficiency提升很大

二,我们希望K2有好的Agentic能力,对于Agentic模型来讲,最大挑战是模型的泛化

它可能是一个从“缸中之脑”变成可以跟世界交互,因为所谓Agent最重要的特征是,可以多轮地使用工具

人是所谓的universal constructor(万能构造器)

有一种潜在思路,需要用更AI native(原生人工智能)的方式去训练AI

Muon你去训的时候,它会炸

54:08 既简单又复杂的系统

为什么Kimi从闭源转向开源?

模型训练完成,产品也基本完成了,做交互上的改进当然有价值,但那是锦上添花的一步

多模态不损伤“脑子”已经很好了

你可能学出来的多模态是个“傻的多模态”,我们希望它是个“聪明的多模态”

Scaling Law遇到数据墙了,这是客观事实

数据飞轮很依赖外部环境的feedback(反馈),我们不希望feedback有很多噪声,但现在没有把这个问题解决得非常好

现在看起来,基于FLOPs的scaling是更有效路径,但这个平衡什么时候会发生变化?

很多Long Context架构会影响“智商”

纯粹的Linear Attention(线性注意力机制)可能影响智商,因为这个架构会有一些bias(偏差)

基座模型公司和做Agent产品的应用公司,长期看边界在哪?

今天怎么思考商业模式?API是好生意吗?

Kimi能赚钱吗?

01:25:05 在自己的故事里面

Tim(周昕宇)天天跟我讲——要用RL的方式去管理,而不是用SFT

用RL管理团队最大问题是,你容易被hack

很多复杂性都是人为强行加上去的,实际并没有那么复杂

只能说是在自己的这个故事里面——你不断地感受自己到底是什么样的一个人,你为什么要做这个事情

这个问题我也问过Kimi,他说,AI是“人类文明的放大器”

这也是Kimi跟我讲的——任何中间状态都有可能成为被批评的对象

肯定有恐惧,更多要关注你当前这一步,能做什么?——想这个问题更重要

2024年对杨植麟的访谈:

《和杨植麟聊大模型创业这一年:人类理想的增量、有概率的非共识和Sora》

【更多信息】

文字和视频版同步上线

文字版请前往公众号:语言即世界language is world

视频版请前往Bilibili:张小珺商业访谈录

展开Show Notes
庄明浩
庄明浩
2025.8.27
听起来杨的状态还不错
gpCigqFeC52
gpCigqFeC52
2025.8.27
k2太强,喜欢他的翻译,现在主力翻译就用groq的k2了
只观同学:我也是主要用它的翻译,把有道都卸载了🤣
咬一口很响:为什么你们可以用k2呀,那个不是内侧的嘛
9条回复
牧心k
牧心k
2025.8.28
很喜欢快问快答这个环节,能不能增加一个问题,你最喜欢的历史人物或者你的role model是谁?非常好奇这些大佬们的回答
张小珺
:
YoungTtt
YoungTtt
2025.8.28
友盟被阿里收购,蒋凡今天成了阿里新太子,UC被阿里收购,何小鹏在汽车上找到了自己的价值,杨植麟太年轻了,没必要ego太大,kimi不是你的终局,想想自己对大厂的价值,趁着现在还值钱赶紧打不过就加入,未来还是有你的机会的
Cefoo:作为局外人,只看到你最装
藤原豆腐:路径千千万,局中人自己最清楚自己想要什么,走别人走过的路不代表是自己的最优解。
11条回复
怪兽_IdMz
怪兽_IdMz
2025.8.29
访谈的节奏有点奇怪,商业访谈的话其实不需要探讨到那么深的技术细节,如果是技术探讨有些问题又感觉没提到关键上。依然是一期很好的播客,感谢小珺
五子哥:又不是22 23年,大模型不管是商业还是技术,都在收敛,你应该管理自己的预期
网海拾贝
网海拾贝
2025.8.27
什么叫“一方的agent产品”?没太听懂🥹
gpCigqFeC52:manus就是第三方agent,ChatGPT agent就是一方agent,说白了用自家基模做的agent就是一方agent,套壳的agent就是第三方agent
庄明浩:一方对应的是第三方 大模型厂商的一方agent产品=大模型厂商自己做的agent产品(比如openai做的chatgpt agent)
9条回复
小逸Louie
小逸Louie
2025.8.27
听完之后,耳边仿佛响起了Kate Bush的《Running Up That Hill》
感谢分享~结尾换了语言即世界工作室的介绍,祝工作室越来越好,期待更多的对谈(✧◡✧)
露露大大
露露大大
2025.8.28
听了半天,就是这个产品一定会失败,没有听出来什么特别的地方,一直会落后挨打
林两半
林两半
2025.8.28
我第一次看到kimi 的长相 他看着好年轻啊哈哈
黑桃小喵子:你要是两年前看到会感觉更年轻,现在发福了😂
小健_gVHx
小健_gVHx
2025.9.08
对话很舒服,请问下 植麟 的即刻多少?
李叨叨
李叨叨
2025.8.28
听出来杨的紧张,毕竟不到半年就被超越,这种天上地下的感觉太难受了
春眺路
春眺路
2025.8.30
听小郡访谈比老罗的访谈过瘾多了~
如实而来:wind值得去替代,金融领域付费意愿强,且远没有满足需求
gpCigqFeC52
gpCigqFeC52
2025.8.27
等k2的思维模型
DHHD
DHHD
2025.9.03
58:21 很明显杨不想来源,但是迫于外部/内部压力做了来源
Gontus46
Gontus46
2025.8.28
谢谢小珺和植麟的分享,这期刚发出来的时候就很期待,因为第一次接触具体国内 AI 相关模型发展应该就是 Moonshot 自己的一个播客,然后也还记得年初 deepseek 和 kimi 几乎同时发的论文,之后和那期读论文的播客一起拆解了具体的内容,被两家公司在训练架构上的创新所震撼,当时也觉得蛮为 kimi 感到可惜的。作为一个一直用 k2 当搜索引擎和编程(Claude code) 的用户,真的效果还是很好的,很期待之后的模型!这期播客播客中记忆最深刻的就是“问题是无法避免的,问题是可以解决的”,从各方面而言,我真的感受到了嘉宾对 AGI 研究的信念和执着,作为一个很想看到 AGI 未来的理想主义者,有一种立刻想去投简历的冲动 hhhh!从嘉宾每次的访谈里都能听出来一种对技术的执着,在大部分人都在聊 PMF 的时候,真的感受到了对整个模型训练创新的热情。之前自己做产品的时候有一种不知道自己位置迷茫的无力感,嘉宾的分享让我意识到我还是很想参与其中看到那个 AGI 的未来的,本身这个攀登的过程就是我要的体验吧。可能一个公司想要活下去,商业方面的 PMF 是必要的,但我希望像 kimi 这种能够坚持从智能方面进行创新的公司能够坚持和得到更多人的支持,因为是这些人的坚持让我们离那个 AGI 的未来越来越近的,加油!希望我也有一天能参与其中
July_777
July_777
2025.8.30
最后也未提一句 deepseek,是剪掉了么?
小米魔女
小米魔女
2025.8.30
46:28 同意 benchmark 很难找到,现在看到测试分数都没有太大意义
kamu
kamu
2025.8.28
边听播客,边让kimi帮忙统计一段文案中的数字,还是没算对,“数数”一直是模型的一个不大不小的问题,可以解奥数题,文章中常规的数字统计经常出错😂……一直在讲能力泛化,能先把这个能力给泛化掉吗? 不过,豆包也没算对,但是同样提示词,豆包的输出明显更好……

可能,杨老板对模型即产品的执念太深了……如果模型能力不体现在产品上,怎么证明模型能力很强呢?
各有所鸣
各有所鸣
2025.8.30
🈶哪位朋友听清张总推荐的书名吗?我好像错过了……谢谢
张小珺
:
The beginning of Infinity
林四十
林四十
2025.8.28
这期没有多少实际内容。 尤其是开头和结尾,聊人生聊哲学的小作文没意义。