138. 对罗福莉3.5小时访谈:AI范式已然巨变!OpenClaw、Agent范式很吃后训练、卡的分配、组织平权张小珺Jùn|商业访谈录

138. 对罗福莉3.5小时访谈:AI范式已然巨变!OpenClaw、Agent范式很吃后训练、卡的分配、组织平权

217分钟 ·
播放数5770
·
评论数57

2026年,大模型战争全面升级,掀开了第二幕——从Pre-train(预训练)主导的Chat时代,转向Post-train(后训练)主导的Agent时代。

在AI范式巨变之际,我访谈了人工智能研究员罗福莉。罗福莉曾供职阿里达摩院、DeepSeek,目前是小米大模型团队负责人,主导研发了MiMo-V2系列模型。她在网络空间有很多标签,例如“AI天才少女”,但她不喜欢这个称呼。

这次是她的第一次访谈,也是她第一次进行长时间的技术访谈。

我们系统性地谈论了,2026年由Claude Opus 4.6、OpenClaw等技术变量所触发的AI巨震,以及后续结构性影响。

在这个生产力大爆炸的时代,人人都有危机感。哪怕是对于亲手训练模型的研究者来说。

“我之前认为我们自己做的工作已经足够有创造力、足够不会被Skill化、不会被Workflow化。但我现在发现,它竟然也能!那它可不可以训出更强的模型?自己左脚踩右脚就提升了?——这是这一两年会发生的事情。”

当人类的知识与智慧内化为模型能力,未来的人类去做什么?我们的社会如何消化这次剧烈的技术变革?——这些宏大的时代命题我们不得而知。

但无论如何,这仍然是一次信息密度极大的访谈——你能从中看见,当面临一次巨大技术范式转折时,一家AI Lab内部,在技术押注、资源调配、组织与人员等诸多方面的系列举措。而它应对巨变的根基是,文化与价值观的成型。

罗福莉对当下有一些关键的技术判断:
  • Anthropic的路径是正确的,这是当下共识。
  • 在路径更清晰的情况下,国内大模型团队进入加速追赶的状态。现在大家在Pre-train上的代差是基本没有的,或者说非常接近。
  • 现在至少跟23年要去追平Pre-train的差距一样,大家很all in,要去做好Agent的Post-train。更具体说,是在Agent上怎么做好RL的scaling。
  • 系统从“以Rollout推理引擎为核心”,转变为“以Agent为核心”的一个更复杂系统。这对团队提出了更高的要求:必须具备足够敏捷性,能够快速开发出适配当前时代的RL Infra系统。
  • 接下来两三个月,大家怎么发生变化,是考验团队整体研究水平、技术敏捷程度,以及怎么拥抱新的范式来做研究的关键。
  • 一个for更长期的事情:我们不会在1T水平上走太久。如果要拿到下一个阶段的领先,就要寻求更大规模scaling。到底是去scaling模型的参数量,还是去scaling什么东西?以及要在什么样的芯片上去scaling?——这是当下立即需要去决策和判断的,这才决定了大半年过后谁更领先。
在卡的调配上:
  • 至少在Chat时代,for研究、for Pre-train和for Post-train的用卡比例非常夸张,比如3比5比1,现在一个非常合理的用卡比例可能是3比1比1。
  • 预训练跟后训练一个比例,这是今年可能发生的很大变化。顶尖团队应该都是1比1了。
在组织的重组上:
  • 做后训练现在一个重要的范式变化是,需要具备diversity(多样性),让预训练的人做后训练是个很好的补充。

“接下来两三个月会非常精彩。”罗福莉称。

接下来,就是我对罗福莉的访谈。

OUTLINE:

00:02:16 OpenClaw引发巨变

00:24:17 群体智能提升Agent框架

00:41:31 2026是生产力变革之年

01:01:45 Agent的自进化与自迭代

01:19:39 MiMo-V2:觉醒和伏击

01:45:24 1T模型是入场券

01:52:33 组织平权

02:02:56 训练细节和成本

02:09:03 另类架构

02:22:32 AI没有生存危机

02:39:12 每天在否认昨天的自己

02:48:34 过去3年的AI进化史

03:05:54 当下共识与竞争

03:19:45 环境比经验更重要

LINKS:

我们的播客在小宇宙Apple Podcast、Spotify等全音频平台播出;

我们的视频播客在Bilibili小红书、视频号、抖音等全视频平台播出;

如果你想服用文字版,请搜索我们工作室的公众号:语言即世界language is world。

本集文字版:《独家对话罗福莉:AI范式已然巨变!》

DISCLAIMER: 本内容不作为投资建议。

CONTACT: xiaojunzhang@lisw.ai

Jump into the new world-and explore with us!😉

展开Show Notes
这个月简直和过年一样,百花齐放,学不完了😭
薯条哲学家海鸥同学:3:23:57 这里我理解是一线经验很重要,有时候要降低输入噪音
姥姥王
姥姥王
7小时前
恭喜DeepSeek开枝散叶,聚是一团火,散是满天星!
0xffbin
0xffbin
7小时前
DeepSeekV4
0xffbin:今天 preview 发布了,应景
果燃_wumV
果燃_wumV
3小时前
呃呃呃呃语气词太多,听着好难受,播客能不能剪辑一下🥺
恒不戳
恒不戳
7小时前
这也太牛了,有没有机会能采访一下kaiming
人很厉害,但表达一般,让人有点看不下去
庄非
庄非
7小时前
期待采访王兴
Spark_EZtJ
Spark_EZtJ
7小时前
有视频吗?
张小珺
:
有的
Spark_EZtJ:找到了
李叨叨
李叨叨
7小时前
听到现在可以发现,火的现象级而已,积累还是不够,能力差距能听出来
AmberJing
AmberJing
3小时前
感谢分享~这期访谈信息量很大,顺手整理了一下memo,分享一下给还没来得及听完全片的朋友们探讨
https://younavi.me/doc/9ggxcWd_Y5Ue-ntOkff4UCEjjgw

一、 核心观点
AI范式的代际转变: 2026年是大模型战争的“第二幕”,核心命题从单纯的对话能力转向了自主性更强的Agent能力。竞争的准入门槛演变为:拥有1T以上参数量的基座模型,并具备接近Claude 4.6 Opus水平的自主代理能力。

Agent框架对模型能力的补齐: 以OpenClaw为代表的开源智能体框架,其核心逻辑是通过复杂的编排(如持久化记忆、自主调度、环境感知)来弥补模型本身的短板。这使得中层模型在85%的任务场景下能发挥出顶尖模型的水准。

算力分配比例重构: 在当前的研发范式下,算力投入的理想比例应为:研究、预训练、后训练约为 3:1:1。后训练(Post-training)的重要性已提升至与预训练相当的地位。

代码是长程任务的基石: 代码数据具备极强的泛化性,是训练模型长上下文建模能力(如128K到1M)的最佳土壤。软件开发过程中的长程交互逻辑,可以平滑迁移至其他复杂的生产力场景。

自学习与双向流动: 智能体的自学习源于模型与Agent架构的同步演进。模型在进步的同时改变框架编排,而框架则为模型提供更精准的环境反馈和静态/动态信息,形成闭环。

二、 精彩言论
“环境比经验更重要。在AI范式巨变的当下,传统的大模型背景可能会成为禁锢,而敏捷的适应力和对新范式的直觉才是核心竞争力。”

“产品是人机交互的那一层薄壳,而Agent框架是人和模型之间厚重的中间层。未来的UI展示将不再关键,关键在于中间层对模型长短板的调度与调度优化。”

“AGI的到来不需要一个清晰的定义。当每个人的生活、工作方式被潜移默化地彻底改变时,所有人都会感知到它的发生。”

“我不再看学术论文。在拥有大规模算力的团队里,相信自己亲手做出的实验结果,比相信论文里的数据更有意义。”

三、 启发与洞察
研究效率的指数级跳跃: 在Agent辅助下,原本需要一两周的科研任务(从写代码到评估设计)可以缩减至一两个小时。这种效率的提升不仅是速度快慢,而是决定了能否在同一时间并行验证多个创新思路。

群体智能的威力: 开源Agent框架(如OpenClaw)的进化速度远超闭合框架。通过全球开发者贡献的Skills,人类的经验被转化为Agent可调用的技能集,这实际上是互联网可访问知识之外的一种“智能增量”。

去中心化的组织实验: 罗福莉在小米团队推行了极度平权、无职级、无固定分组的组织形态。这种“创业式”的管理旨在避免规范压制创造力,让热爱驱动的人在模糊的边界中自由协作,以应对瞬息万变的技术路线。

从成本领先到价值领先: 早期模型竞争依赖API价格战(如MiMo-V2 Flash的极致性价比),但进入Agent时代后,定价逻辑将转向模型创造的生产力价值。MTP(多Token预测)等架构创新,其本质是在追求单位算力下的最高价值产出。

AGI的时间表缩短: 访谈中指出,由于AI已经展现出“左脚踩右脚”式自迭代的苗头,AGI的实现历程可能已完成20%,并在未来一两年内走向爆发。

四、 2026年竞争胜负手
预训练基座不能错: 1T级参数规模且在Code/Math场景有深厚积淀的基座是入场券。

敏捷的后训练系统: 能够针对不断演变的Agent框架,快速设计新的RL(强化学习)Infra。

战略资源的耦合: 智能体能否高效调度操作系统、硬件、能源及流量等生态资源。

敢于否定昨日之我: 彻底思考现有组织结构是否适配新的生产力逻辑,甚至包括对自己团队规模的重新定义。
刘纯钦
刘纯钦
5小时前
当你最强的核心能力是整合时,大力提倡开源好像没什么问题,太小米了
21:45 claude code现在也不是黑盒了,源代码已经公布了,基本上可以算白盒。 我认为如果模型厂商要增强code或Agentic能力,肯定是要详细钻研claude code的设计源码
LearnWise
LearnWise
7小时前
下一个梁文峰。
omo 重磅的一期
Chrisbank_
Chrisbank_
7小时前
🤣太卷了吧 学不过来
小紧张的感觉😅纳闷她用龙虾的体验怎么跟我完全不一样,小模型也能完成度很高😂
这就是技术大佬和普通人玩同一个harness的差距呀
yisenn:我感觉是因为她的工作是训练模型,所以会从供给侧/成本角度考虑,大部分人纯消费侧视角。(一个想法不一定对)
PlayWithAI:同感,对openclaw的认知感觉还是chatgpt阶段,比如拼接时间,记忆,情商
的地的
的地的
4小时前
刚听完卫诗婕 | 漫谈 小米陈龙这期就接上了,谢谢。
17:40 现在可以了😂基本开源稳定版在社区已经有了
Benicer
Benicer
7小时前
太棒了,对这位优秀的女性非常感兴趣!另外,梦秋的年更节目有计划不(🤭)
Madkeen
Madkeen
7小时前
梁文锋还会远吗