171: 【AI季报 26Q2】从 coding 到 RSI,强者愈强的未来?晚点聊 LateTalk

171: 【AI季报 26Q2】从 coding 到 RSI,强者愈强的未来?

100分钟 ·
播放数3677
·
评论数6

眼下的竞争 & 未来的焦点。

继续带来 2026 年 Q2 的 AI 季报,嘉宾仍是 MoE Capital 创始合伙人 Henry Yin。

这个季度,我们沿两条脉络来看 AI 的进展,一是推进智能前沿

  • OpenAI 和 Anthropic 间的竞争:上季度季报预言的 Codex “反扑”,本季发展如何?

  • RSI(Recursive Self-Improvement,递归自进化):延续上季季报的 AutoResearch/自进化的讨论,RSI 在 Q2 大热,Anthropic 专门写了 RSI 长文《When AI builds itself》,更多新创业公司正在涌现。上周内,我就了解到数个在这一方向创业的新团队,有些已经官宣,更多还在水下。
    本期播客封面,即是这篇文章中,Anthropic 对过去的工作循环和未来 AI 参与更多的 RSI 状态的设想图示。

  • Robotics 和物理 AI:不仅 Sam Altman 在 5 月底官宣了 OpenAI Robotics 团队,行业传言, Anthropic 也在考虑这个方向。

第二条线是智能的扩散:

  • 更多企业客户想要自己的模型——这成为 Fireworks、Applied Compute 等美国科技公司和智谱 GLM 等中国开源模型的共同机会。

  • 交互创新:OpenAI 带来了 Record and Replay,Claude 终于接入 Slack 群协作(Claude Tag);Thinking Machines Lab 带来创新的流式语音模型 Interaction Model。

最后,我们补充聊了 Google、Meta、xAI 的近况,还有很久没上头条的 Midjourney,它居然做起了超声波医学影像设备。创始人 Holz 聊起新业务时说:“我们甚至还没用到 AI”。

*一个小说明:我们录这期节目时是 6 月 27 日。这之后行业又有重要变化,如 Anthropic Fable 5 恢复全量上线。节目里的这部分内容有滞后。

本期稍晚也会发布图文版。节目中聊到的一些新公司、人物和行业术语,可先参考 shownotes 末尾的「附录」。

本期嘉宾:
Henry Yin,MoE Capital 创始合伙人
本期主播:
程曼祺,晚点科技报道负责人

时间线:

04:20 上季季报回顾:延续的、反转的

【推进智能前沿】
-OpenAI vs Anthropic
08:21 当前竞争:两家的新模型、coding Agent 份额和价格战
19:26 相关第三方:被收购的 Cursor,创业公司中的第一名仍有高额溢价
22:01 对模型已最强的公司来说,不是”模型即产品“

-RSI 递归自进化
28:04 是什么?为什么火?涌现的新团队
32:14 Anthropic 长文《When AI builds itself》
39:15 Recursive Superintelligence 6 月中旬的第一批具体成果

-物理 AI
43:14 OpenAI 官宣 Robotics 团队,Anthropic 为何也考虑做机器人?
46:24 《世界模型》研究报告的梳理与发现

【智能的扩散】
51:39 美国公司用中国开源模型,自己拥有自己的模型
01:05:59 新的交互:Record & Replay、Claude Tag;TML 和 OpenAI realtime 的本季语音新模型

【其它重点公司】
01:23:25 Meta、Google、xAI 近况;赶上最强梯队的可能性?
01:34:26 Midjourney 的”不务正业“,发布超声波医学影像设备全身扫描器

剪辑:Nick、甜食

相关链接:
往期 AI 季报:
156 期 【AI季报 26Q1】OpenClaw、OpenAI vs Anthropic的三重对阵、自进化
156 期 图文版

往期具身季报:
170 期 【具身季报 26Q2】世界模型大风不停,和不想被贴标签的人
170 期 图文版

157 期 【具身季报 26Q1】宇树招股书、人形再思考、英伟达世界模型、高自由度灵巧手
157 期 图文版

2025 年末回顾:
150 期 年末 AI 回顾:从模型到应用、从技术到商战,拽住洪流中的意义之线
150 期 图文版

附录:本期中出现的一些公司、人物、技术术语:

公司/机构 & 相关人物
Recursive Superintelligence(RSI) — Richard Socher(前 Salesforce 首席科学家、You.com 创始人)、田渊栋(前Meta FAIR研究总监)、施天麟(Tim Shi,Cresta 联创)等 8 位联合创始人一起创立的 Neo Lab,做“递归自我改进”研究,6 月初官宣,估值 46.5 亿美元。
Mirendil — 由 Anthropic 负责 AI 科研相关团队的 Behnam Neyshabur 和 Harsh Mehta 等人创立,“用 AI 自动化AI研究”,6 月 25日官宣,估值 10 亿美元。
Core Automation — 由前 OpenAI 研究VP Jerry Tworek 创立,打造自动化程度最高的 AI 实验室,探索超越预训练和 Transformer 架构的新方法。
Dream Labs — 由Nvidia GEAR Lab的研究员 Joe Jang 创立,主导过DreamGen、DreamZero、DreamDojo 等机器人世界模型研究。
Applied Compute — 由前 OpenAI 研究员 Yash Patil、Rhythm Garg、Linden Li 创立,主营“后训练即服务”,帮企业在开源模型基础上训练专属模型。
Fireworks(AI) — 模型托管与推理服务平台,创始人兼CEO Lin Qiao 曾是 Meta PyTorch 团队负责人。
Harvey — 法律AI公司,本季度先后与 Applied Compute、Fireworks 合作,在 GLM-5.1 等开源模型基础上训练法律agent,在自家 Legal Agent Benchmark 上超过了 Anthropic 和 OpenAI 的模型。
Windsurf — Cursor 曾经的直接竞品,2025 年被 Google 支付约 24 亿美元获得核心团队与技术授权(不是整体收购),后来做出了Google Antigravity 这款 agent IDE。
Devin(Cognition)— 做AI软件工程师agent的公司,除了卖工具,也直接卖服务。
Palo Alto Networks — 网络安全公司,与 Anthropic 有安全领域的深度合作(Project Glasswing),其 CEO 本季度在X上公开呼吁Anthropic给Claude降价。

其它人物:
Boris Cherny、Cat(Catherine)Wu — Anthropic Claude Code的核心工程与产品负责人,两人在X上都有大量关注者,是 Claude Code 声量的重要来源。
Aditya Ramesh — OpenAI 机器人团队负责人,此前领导过 Sora 和 DALL-E 的研发。
Noam Shazeer — Transformer 论文(Attention Is All You Need)八位作者之一,2026 年 6 月从 Google(时任Gemini 联合负责人)跳槽到 OpenAI。

技术/行业术语:
本期中提到的一系列 Benchmark:SWE-bench Pro、Terminal-bench、Agents' Last Exam、OS World 分别衡量编程能力、终端里多步骤且需要用工具的任务能力、综合 agent 能力,以及computer use(电脑操作)能力。
Harness — AI agent 运行时的“脚手架”,决定它怎么调用工具、怎么组织多步任务,不是模型本身,但直接影响实际表现。
FDE(Forward Deployed Engineer,前向部署工程师) — 派驻到客户现场、帮企业把AI能力落地到具体业务里的工程师,近期很热门的岗位。
VADVoice Activity Detection语音活动检测 — 判断说话人是否停顿、该轮到谁说话的技术,目前大多数"实时语音"AI靠这个模拟对话感,本质还是轮流说话的"对讲机"模式。
Token maximalism — 2026年一季度企业鼓励员工尽量多用AI token的一波风潮,后来因为投入产出不成比例,逐渐降温、被用量配额取代。
MCI — Meta 内部一个通过在员工电脑上装软件、录制操作过程来训练 AI 的项目,因隐私争议和数据泄露被叫停。

小红书@曼祺_火柴Q即刻@曼祺_火柴Q

☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆

欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。
这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。

请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。

关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:

展开Show Notes
曼祺_MatchQ
曼祺_MatchQ
5小时前
置顶
准备这个季度节目时,看到上一期 AI 季报的标题就“自进化”,当时我和 Henry 就聊了很多 Auto Research。而到了 4、5 月,一季度季报里的 Auto Research 变成了一股更明确的趋势,也有更多人会用 RSI(递归自进化)。(自动和递归其实有差异,现在确实常一起被提及,被视为目标。)

对两家 Frontier Labs——Anthropic 和 OpenAI ,RSI 的吸引力是:如果达到了这一状态,AI 能力能一个不断重复的循环(loop)里,快速、(大部分)自动地往前迭代。这会使他们的加速度越来越大,强者愈强,甩开更落后者。而他们做这件事的优势就是,Coding 和 Agentic 的能力对 RSI 非常重要

另一方面,更多新团队也想在这个方向创业:
他们中的多数是从 Agent 层入手,利用现在更强的 Coding 能力,在一些具体领域如办公、特定的研究、量化等方向摘取看起来不太遥远的果实。
也有技术野心更大的团队认为,目前被最核心 AI Lab 掌握的 Coding 和长程 Agentic 能力并不是 RSI 的全部,它还需要更多东西,这就是更底层技术变化和创新的机会。

当然,目前 RSI 是新公司、新团队多,但具体进展还没有那么多。我也很期待再往后的一段时间,它会如何发展?

RSI 会是 Coding 之后的下一个节奏点吗?我们之后的 AI 季报也会持续跟踪。
強者恆強,弱者恆科。
tsalb
tsalb
5小时前
终于来了
长跑男
长跑男
2小时前
1:20:23 查了一下,创始人是 john schulman ,视听双工模型,这玩意真是应该配合新硬件一起出。
花小撒
花小撒
3小时前
码了!
Naomiiixia
Naomiiixia
15分钟前
👍👍👍