171: 【AI季报 26Q2】从 coding 到 RSI，强者愈强的未来？

眼下的竞争 & 未来的焦点。

继续带来 2026 年 Q2 的 AI 季报，嘉宾仍是 MoE Capital 创始合伙人 Henry Yin。

这个季度，我们沿两条脉络来看 AI 的进展，一是推进智能前沿：

OpenAI 和 Anthropic 间的竞争：上季度季报预言的 Codex “反扑”，本季发展如何？

RSI（Recursive Self-Improvement，递归自进化）：延续上季季报的 AutoResearch/自进化的讨论，RSI 在 Q2 大热，Anthropic 专门写了 RSI 长文《When AI builds itself》，更多新创业公司正在涌现。上周内，我就了解到数个在这一方向创业的新团队，有些已经官宣，更多还在水下。
本期播客封面，即是这篇文章中，Anthropic 对过去的工作循环和未来 AI 参与更多的 RSI 状态的设想图示。

Robotics 和物理 AI：不仅 Sam Altman 在 5 月底官宣了 OpenAI Robotics 团队，行业传言， Anthropic 也在考虑这个方向。

第二条线是智能的扩散：

更多企业客户想要自己的模型——这成为 Fireworks、Applied Compute 等美国科技公司和智谱 GLM 等中国开源模型的共同机会。

交互创新：OpenAI 带来了 Record and Replay，Claude 终于接入 Slack 群协作（Claude Tag）；Thinking Machines Lab 带来创新的流式语音模型 Interaction Model。

最后，我们补充聊了 Google、Meta、xAI 的近况，还有很久没上头条的 Midjourney，它居然做起了超声波医学影像设备。创始人 Holz 聊起新业务时说：“我们甚至还没用到 AI”。

*一个小说明：我们录这期节目时是 6 月 27 日。这之后行业又有重要变化，如 Anthropic Fable 5 恢复全量上线。节目里的这部分内容有滞后。

本期稍晚也会发布图文版。节目中聊到的一些新公司、人物和行业术语，可先参考 shownotes 末尾的「附录」。

本期嘉宾：
Henry Yin，MoE Capital 创始合伙人
本期主播：
程曼祺，晚点科技报道负责人

时间线：

04:20 上季季报回顾：延续的、反转的

【推进智能前沿】
-OpenAI vs Anthropic
08:21 当前竞争：两家的新模型、coding Agent 份额和价格战
19:26 相关第三方：被收购的 Cursor，创业公司中的第一名仍有高额溢价
22:01 对模型已最强的公司来说，不是”模型即产品“

-RSI 递归自进化
28:04 是什么？为什么火？涌现的新团队
32:14 Anthropic 长文《When AI builds itself》
39:15 Recursive Superintelligence 6 月中旬的第一批具体成果

-物理 AI
43:14 OpenAI 官宣 Robotics 团队，Anthropic 为何也考虑做机器人？
46:24 《世界模型》研究报告的梳理与发现

【智能的扩散】
51:39 美国公司用中国开源模型，自己拥有自己的模型
01:05:59 新的交互：Record & Replay、Claude Tag；TML 和 OpenAI realtime 的本季语音新模型

【其它重点公司】
01:23:25 Meta、Google、xAI 近况；赶上最强梯队的可能性？
01:34:26 Midjourney 的”不务正业“，发布超声波医学影像设备全身扫描器

剪辑：Nick、甜食

相关链接：
往期 AI 季报：
156 期【AI季报 26Q1】OpenClaw、OpenAI vs Anthropic的三重对阵、自进化
156 期图文版

往期具身季报：
170 期【具身季报 26Q2】世界模型大风不停，和不想被贴标签的人
170 期图文版

157 期【具身季报 26Q1】宇树招股书、人形再思考、英伟达世界模型、高自由度灵巧手
157 期图文版

2025 年末回顾：
150 期年末 AI 回顾：从模型到应用、从技术到商战，拽住洪流中的意义之线
150 期图文版

附录：本期中出现的一些公司、人物、技术术语：

公司/机构 & 相关人物
Recursive Superintelligence（RSI） — Richard Socher（前 Salesforce 首席科学家、You.com 创始人）、田渊栋（前Meta FAIR研究总监）、施天麟（Tim Shi，Cresta 联创）等 8 位联合创始人一起创立的 Neo Lab，做“递归自我改进”研究，6 月初官宣，估值 46.5 亿美元。
Mirendil — 由 Anthropic 负责 AI 科研相关团队的 Behnam Neyshabur 和 Harsh Mehta 等人创立，“用 AI 自动化AI研究”，6 月 25日官宣，估值 10 亿美元。
Core Automation — 由前 OpenAI 研究VP Jerry Tworek 创立，打造自动化程度最高的 AI 实验室，探索超越预训练和 Transformer 架构的新方法。
Dream Labs — 由Nvidia GEAR Lab的研究员 Joe Jang 创立，主导过DreamGen、DreamZero、DreamDojo 等机器人世界模型研究。
Applied Compute — 由前 OpenAI 研究员 Yash Patil、Rhythm Garg、Linden Li 创立，主营“后训练即服务”，帮企业在开源模型基础上训练专属模型。
Fireworks（AI） — 模型托管与推理服务平台，创始人兼CEO Lin Qiao 曾是 Meta PyTorch 团队负责人。
Harvey — 法律AI公司，本季度先后与 Applied Compute、Fireworks 合作，在 GLM-5.1 等开源模型基础上训练法律agent，在自家 Legal Agent Benchmark 上超过了 Anthropic 和 OpenAI 的模型。
Windsurf — Cursor 曾经的直接竞品，2025 年被 Google 支付约 24 亿美元获得核心团队与技术授权（不是整体收购），后来做出了Google Antigravity 这款 agent IDE。
Devin（Cognition）— 做AI软件工程师agent的公司，除了卖工具，也直接卖服务。
Palo Alto Networks — 网络安全公司，与 Anthropic 有安全领域的深度合作（Project Glasswing），其 CEO 本季度在X上公开呼吁Anthropic给Claude降价。

其它人物：
Boris Cherny、Cat（Catherine）Wu — Anthropic Claude Code的核心工程与产品负责人，两人在X上都有大量关注者，是 Claude Code 声量的重要来源。
Aditya Ramesh — OpenAI 机器人团队负责人，此前领导过 Sora 和 DALL-E 的研发。
Noam Shazeer — Transformer 论文（Attention Is All You Need）八位作者之一，2026 年 6 月从 Google（时任Gemini 联合负责人）跳槽到 OpenAI。

技术/行业术语：
本期中提到的一系列 Benchmark：SWE-bench Pro、Terminal-bench、Agents' Last Exam、OS World 分别衡量编程能力、终端里多步骤且需要用工具的任务能力、综合 agent 能力，以及computer use（电脑操作）能力。
Harness — AI agent 运行时的“脚手架”，决定它怎么调用工具、怎么组织多步任务，不是模型本身，但直接影响实际表现。
FDE（Forward Deployed Engineer，前向部署工程师） — 派驻到客户现场、帮企业把AI能力落地到具体业务里的工程师，近期很热门的岗位。
VAD（Voice Activity Detection，语音活动检测） — 判断说话人是否停顿、该轮到谁说话的技术，目前大多数"实时语音"AI靠这个模拟对话感，本质还是轮流说话的"对讲机"模式。
Token maximalism — 2026年一季度企业鼓励员工尽量多用AI token的一波风潮，后来因为投入产出不成比例，逐渐降温、被用量配额取代。
MCI — Meta 内部一个通过在员工电脑上装软件、录制操作过程来训练 AI 的项目，因隐私争议和数据泄露被叫停。

小红书@曼祺_火柴Q即刻@曼祺_火柴Q

☆《晚点聊 LateTalk》建立「播客听友群」啦！☆

欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流，第一时间收听新节目。
这里有更多互动，更多话题讨论。欢迎贡献选题 & 推荐嘉宾。

请先添加「晚点」小助手的微信号，备注：“晚点聊”，我们邀请您入群。

关注公众号《晚点 LatePost》和《晚点对话》，阅读更多商业、科技文章：