138. 对罗福莉3.5小时访谈:AI范式已然巨变!OpenClaw、Agent范式很吃后训练、卡的分配、组织平权张小珺Jùn|商业访谈录

138. 对罗福莉3.5小时访谈:AI范式已然巨变!OpenClaw、Agent范式很吃后训练、卡的分配、组织平权

217分钟 ·
播放数129126
·
评论数322

2026年,大模型战争全面升级,掀开了第二幕——从Pre-train(预训练)主导的Chat时代,转向Post-train(后训练)主导的Agent时代。

在AI范式巨变之际,我访谈了人工智能研究员罗福莉。罗福莉曾供职阿里达摩院、DeepSeek,目前是小米大模型团队负责人,主导研发了MiMo-V2系列模型。她在网络空间有很多标签,例如“AI天才少女”,但她不喜欢这个称呼。

这次是她的第一次访谈,也是她第一次进行长时间的技术访谈。

我们系统性地谈论了,2026年由Claude Opus 4.6、OpenClaw等技术变量所触发的AI巨震,以及后续结构性影响。

在这个生产力大爆炸的时代,人人都有危机感。哪怕是对于亲手训练模型的研究者来说。

“我之前认为我们自己做的工作已经足够有创造力、足够不会被Skill化、不会被Workflow化。但我现在发现,它竟然也能!那它可不可以训出更强的模型?自己左脚踩右脚就提升了?——这是这一两年会发生的事情。”

当人类的知识与智慧内化为模型能力,未来的人类去做什么?我们的社会如何消化这次剧烈的技术变革?——这些宏大的时代命题我们不得而知。

但无论如何,这仍然是一次信息密度极大的访谈——你能从中看见,当面临一次巨大技术范式转折时,一家AI Lab内部,在技术押注、资源调配、组织与人员等诸多方面的系列举措。而它应对巨变的根基是,文化与价值观的成型。

罗福莉对当下有一些关键的技术判断:
  • Anthropic的路径是正确的,这是当下共识。
  • 在路径更清晰的情况下,国内大模型团队进入加速追赶的状态。现在大家在Pre-train上的代差是基本没有的,或者说非常接近。
  • 现在至少跟23年要去追平Pre-train的差距一样,大家很all in,要去做好Agent的Post-train。更具体说,是在Agent上怎么做好RL的scaling。
  • 系统从“以Rollout推理引擎为核心”,转变为“以Agent为核心”的一个更复杂系统。这对团队提出了更高的要求:必须具备足够敏捷性,能够快速开发出适配当前时代的RL Infra系统。
  • 接下来两三个月,大家怎么发生变化,是考验团队整体研究水平、技术敏捷程度,以及怎么拥抱新的范式来做研究的关键。
  • 一个for更长期的事情:我们不会在1T水平上走太久。如果要拿到下一个阶段的领先,就要寻求更大规模scaling。到底是去scaling模型的参数量,还是去scaling什么东西?以及要在什么样的芯片上去scaling?——这是当下立即需要去决策和判断的,这才决定了大半年过后谁更领先。
在卡的调配上:
  • 至少在Chat时代,for研究、for Pre-train和for Post-train的用卡比例非常夸张,比如3比5比1,现在一个非常合理的用卡比例可能是3比1比1。
  • 预训练跟后训练一个比例,这是今年可能发生的很大变化。顶尖团队应该都是1比1了。
在组织的重组上:
  • 做后训练现在一个重要的范式变化是,需要具备diversity(多样性),让预训练的人做后训练是个很好的补充。

“接下来两三个月会非常精彩。”罗福莉称。

接下来,就是我对罗福莉的访谈。

OUTLINE:

00:02:16 OpenClaw引发巨变

00:24:17 群体智能提升Agent框架

00:41:31 2026是生产力变革之年

01:01:45 Agent的自进化与自迭代

01:19:39 MiMo-V2:觉醒和伏击

01:45:24 1T模型是入场券

01:52:33 组织平权

02:02:56 训练细节和成本

02:09:03 另类架构

02:22:32 AI没有生存危机

02:39:12 每天在否认昨天的自己

02:48:34 过去3年的AI进化史

03:05:54 当下共识与竞争

03:19:45 环境比经验更重要

LINKS:

我们的播客在小宇宙Apple Podcast、Spotify等全音频平台播出;

我们的视频播客在Bilibili小红书、视频号、抖音等全视频平台播出;

如果你想服用文字版,请搜索我们工作室的公众号:语言即世界language is world。

本集文字版:《独家对话罗福莉:AI范式已然巨变!》

DISCLAIMER: 本内容不作为投资建议。

CONTACT: xiaojunzhang@lisw.ai

Jump into the new world-and explore with us!😉

展开Show Notes
恒不戳
恒不戳
2026.4.24
这也太牛了,有没有机会能采访一下kaiming
蔚蓝的日子:加一 kaiming说,kaiming说,真的想听kaiming说
陈申健:加一,听完谢赛宁之后感觉脑子里都是何凯明
6条回复
这个月简直和过年一样,百花齐放,学不完了😭
知名薯条哲学家海鸥同学:3:23:57 这里我理解是一线经验很重要,有时候要降低输入噪音
Kelton
Kelton
2026.4.24
这期真的太干了,虽然可能罗老师不太习惯长文中文表述,但真心很有思维很有深度敢于分享
不莱梅乐队:过于彩虹屁了吧。她求学和工作都在国内,显然中文比英文用得更多
孤胆宇少:经常搞实验或者是做科研的人往往嘴跟不上脑子,东西能做出来,但是表述可能就是一个问题。
11条回复
AI_Baymax
AI_Baymax
2026.4.24
听这样播客的时候会去在意口语表达吗?我一点都不在意,我在意的是罗老师带来的信息密度和思考
VV4eito:大众传播还是害怕语言体系有隔阂的,虽然罗老师在努力的用大众词汇翻译产技语言,还是限制了输出
半智能网:你的回答已经说明了很多问题,翻译一下: 我会在意你有没有钱吗? 我在意的是你是否有车有房!
姥姥王
姥姥王
2026.4.24
恭喜DeepSeek开枝散叶,聚是一团火,散是满天星!
很多人在挑战她的表达方式,我觉得很好笑;

这些人对功成名就的人有一些不切实际的期待,这些期待是基于他们想象中一个厉害的人产生的;

一旦通过这样的对话接触到了真实的罗福莉时,幻想破灭,不符合期待,以为不过如此;

有没有可能,她并不是因为表达方式成功的?

建议少靠想象力来理解世界,多看看她们做了什么,表达了什么论据;

真正心里有数的人都有一个认知,现在这个时间点,你尝试过什么,比你想过什么重要的多

论迹不论心;
VV4eito:其实,我觉得她可能是在努力讲得圈外人也能听得懂。仔细听会发现,她只要用产技语言就能表达的很流利
Dwight:是啊,她可是罗福莉啊!罗福莉!
9条回复
我觉得表达能力什么的都不是问题。但是前十分钟对小龙虾的三次让她震惊我觉得完全不能理解。。

第一次震惊是情感和细节:罗老师一定没用 gemini3吧 😂

第二次是对管理模式的启发:这不是大模型本身的能力吗...和小龙虾有啥关系。老师对大模型本身的发展进程真的了解吗

第三次是对研究的启发,说可以通过编排工程解决模型能力低的问题。这个结论也完全不能苟同 🥲
海中央种树:我觉得老师的前十分钟的很多认知和观点都很像一个没怎么接触大模型前沿发展的小白
菜菜的二亩地:非常赞同👍前几个点完全不知道震惊在哪;罗老师对这几个点震惊这件事让我很震惊hhh
10条回复
李叨叨
李叨叨
2026.4.24
听到现在可以发现,火的现象级而已,积累还是不够,能力差距能听出来
leom_dGYL:和之前其他大佬的访谈相比,罗老师相当于一个熟练的算法工程师,术的层面可能很熟练,道的层面认知差其他大佬太远了,作为一号位把握战略方向可能还是有点欠缺
追风小马:展开讲讲?👀
5条回复
Sayhi_bzb
Sayhi_bzb
2026.4.24
很感慨模型研发人员居然不关注应用层,龙虾的架构从去年开始就有 agent 雏形了,也有开源的 g-cli 和 codex 解释了 cc 的底层架构
CheukSing
CheukSing
2026.4.24
太紧张了,听感有点难受
Yummy_AI:好几段已经听进去了 结果被一串连续的呃呃嗯嗯啊啊又搞跑神了
北拳爸爸:很努力把她的话连起来,然后总是被呃呃呃弄得很吃力,听着好累
7条回复
很多时候,表达能力也是一种天生能力。
0xffbin
0xffbin
2026.4.24
DeepSeekV4
0xffbin:今天 preview 发布了,应景
赞一下小珺,感觉你已经很技术了,问题问得很到点!
双鱼_tqYo:3:35:40 建议听一下小珺老师和00后数学AI创业公司的访谈完整版,真心佩服她们俩👍那个访谈里面的提问可能更能显示小珺实力,哈哈哈
Wen16:请问是哪一期?
4条回复
Yiii1984
Yiii1984
2026.4.24
针灸的时候听这个播客,确实很煎熬ಠ_ಠ
嗯嗯啊啊的一点沉浸感也没有...
锦鲤Mark:看视频版很好
一耳朵川渝普通话😅
刘纯钦
刘纯钦
2026.4.24
当你最强的核心能力是整合时,大力提倡开源好像没什么问题,太小米了
HD778048x
HD778048x
2026.4.25
06:48 这里的几个想法有问题啊,作为llm负责人难道不知道回答是取决于模型,而不是openclaw框架自身?为什么会对框架感到amaze和惊讶?
海中央种树:我也觉得 完全不像一个ai前沿工作者的认知 🥲 包括加上一个早安晚安问候。最简单的提示词 gemini3用过也不至于震惊
咖啡装进保温杯:因为回答表现就是部分取决于框架本身。至少目前是。
4条回复
可能是偏技术,所以这种场合经见得略少,也可能是其他,导致会有不少呃。但我觉得无伤大雅,这么优秀的人,这么坦诚的分享,特别值得点赞!!!希望嘉宾不要被评论区的一些评价而影响。
easymode
easymode
2026.4.27
很强的女性榜样!这一期对我来说就算是科普。从来没有听过一线训模型的同学讲这些。之前仅仅是看一些课程,跟着简单的在CPU上训一些神经网络体验。最近也在疯狂的学agent做agent不知道模型底层的训练过程原来是这样。loss飞了,agent泛式需要很强的后训练,各种attention机制的trade off,卡的量级原来千卡集群就可以。虽然听不懂,但是好像有一个大的框架了。
3:06:06 哈哈总是额额的语气词,有时候是欲言又止。我get到了
锦鲤Mark:看视频版会好很多