137: Agent 是机会,造 Agent 的工具也是|从OpenAI开发者日聊起|Agent#6晚点聊 LateTalk

137: Agent 是机会,造 Agent 的工具也是|从OpenAI开发者日聊起|Agent#6

89分钟 ·
播放数18092
·
评论数33

「《晚点聊》✖️ AGI House 第一次聊,之后会陆续更新硅谷的 AI 新趋势。」

本期,我们邀请了两位常驻硅谷的朋友,AGI house 的 Henry Yin 和 Naomi Xia,来一起聊 Agent 工具链(Agentic Tooling)的发展趋势,和这个领域在美国的创业实践。

AGI House 是一个 2023 年开始运营的 AI 创业和投资社区,连接了Andrej Karpathy( OpenAI 联创、Eureka Labs 创始人 )、 Google 创始人 Sergey Brin、Google AI 负责人 Jeff Dean、Anthropic 联创 Ben Mann 等 AI 从业者。


图注:刚刚在 AGI House 组织的技术活动:与 Open AI 论文作者的 technical paper reading event。

Henry Yin 毕业于清华姚班,后前往伯克利攻读博士,期间退学创办思码逸(Merico),用 AI 提升开发者效率,长期关注 Agent 工具链与应用层创新。

Naomi Xia 毕业于沃顿商学院,曾任职于摩根大通 AI 投融资团队,现在负责 AGI House 早期投资,已投资 20 多家公司,如本期提及的 Composio、Livekit 等。

我们第一次录制是在十一前,而假期中的 10 月 6 日,OpenAI 举办了第三次 DevDay,即开发者日。发布了一系列与 Agent 相关的新工具,包括 AgentKit、Evals 等。这次 OpenAI 也带来了 Apps in ChatGPT 和 Apps SDK,这是 ChatGPT 试图变成操作系统的再一次尝试。

本期节目由此分为两部分:

  • 第一部分,我们讨论了刚结束的 DevDay 的亮点;
  • 第二部分,则是对 Agentic Tooling,即 Agent 工具链的发展脉络和当前热门环节的梳理。

这一次是《晚点聊》与 AGI house 两位第一次录制。之后我们会定期邀请 AGI House 团队及其社区连接的成员分享在美国 AI 最核心的区域的新变化。

本期嘉宾:
Henry Yin:AGI House 联创 & CTO,LinkedIn @Henry Yin
Naomi Xia:AGI House 合伙人 & 投资负责人,LinkedIn @Naomi Xia

本期主播:程曼祺,《晚点 LatePost》科技报道负责人

时间线跳转:
-OpenAI 开发者日
03:30 Agentic Kit 是 OpenAI 开放了自己练的“一身武功”
09:06 Apps in ChatGPT 和 2023 年 GPTs 的区别
10:53 Canva in ChatGPT 新体验
14:47 OpenAI 不会放弃 to B
18:16 一种批评,AgenticKit 与 AGI 思路背道而驰
21:15 开发者的机会与压力:在别人的地基上建房子

-Agentic Tooling 的 6 次进化
26:33 Agentic Tooling 是什么?近期 3 笔交易/收购看到的状态
31:24 Agentic Tooling 的 6 次进化,对应模型能力的 6 次提升

-当下环节梳理
工具调用
39:59 MCP Server 集成商是做什么?
43:09 当前调用 MCP Server 的数量限制,创造 Rube 等产品的机会
44:18 Composio,一家从印度来美国的公司,怎么从 Agent 厂商转型 MCP server 服务商
49:09 这真是创业机会吗?为何 Anthropic 自己不做?
Voice
53:09 911 也在用的 AI voice 平台
57:25 从 LiveKit 平台看到的调用偏好:Speech to Speech(语音端到端)和 Cascade 模型现在一半一半
59:28 OpenAI 等核心 Lab 的 Voice 动作
记忆
01:01:57 四种记忆:情景、流程、事实/知识、人格/性格
01:04:26 创业案例:Letta,记忆也可以由第三方来做吗?
01:10:29 记忆和上下文工程
评估
01:11:50 一个重要,但很多人不好好做的环节
01:14:07 评估难,难在构造数据集

-2000-5000 亿的工具生态市场
01:15:27 Okta、Twilio、DataDog 都可以在 AI 时代“再做一遍”
01:21:23 2025 年,“闯美”中国 AI 创业公司变多,它们带来了不一样的野心

相关链接:
图文版:《OpenAI、Google、Anthropic 都在做的 “Agent 工具箱” 是什么丨晚点播客》
晚点聊 129:《中国AI founder如何直接在美国创业? | 对话FinalRound创始人Michael》

附:本期播客里提及的人、公司和具体领域
Merico(思码逸):代码质量、产能分析与工程数据平台,由 Henry Yin 在博士期间联合创立
Andrej Karpathy:OpenAI 联创、Eureka Labs 创始人
Ben Mann:Anthropic 联创
MCP 协议:让大模型能调用各种工具的协议,由 Anthropic 于 2024 年 11 月开源
MCP server:把数据和工具按 MCP 协议做成 AI 可直接调用的服务端
Composio:MCP server 市场,开发者在这个平台上能选择不同 MCP server 以调用工具、完成应用
LiveKit:基于WebRTC(实时通信)的开源音视频通话框架提供商
声网(Agora):实时音视频基础设施提供商
LightSpeed:美国 VC 光速创投,Composio A 轮的领投方
Letta:一家开源 AI 代理框架公司,为智能体研发长期记忆
身份认证:为软件产品或服务提供用户与权限管理服务的 to B 环节
Okta:一家身份认证与访问管理提供商
Twilio:通信云平台公司,开发者可通过 Twilio 平台上的 API 调用短信、语音、视频等通信功能
Observability:为软件开发提供状态或数据的观测/监控服务的 to B 环节
Datadog:Observability 领域上市公司,为应用提供服务器、数据库等监控服务,
Braintrust:一家为 AI 应用提供 evaluation(评估)、observability(可观测性/监控)和 trace 分析等工具的创业公司

剪辑制作:Nick

本期主播:
小红书@曼祺_火柴Q即刻@曼祺_火柴Q

☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆

欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。
这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。

请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。

关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:

展开Show Notes
曼祺_MatchQ
曼祺_MatchQ
2025.10.17
置顶
和 AGI house 的 Henry、Naomi 的第一期,希望之后定期更新他们在旧金山湾区感受到的变化。

美国和中国是 AI 最“卷”的两个区域,信息时间差越来越少,更多是不同视角的互补和碰撞。

这一期我们聊了 Agent 工具链 Agentic Tooling 的发展脉络和当下的一些梳理环节。刚好6号 Open AI devday 有相关更新。

Infra 层和工具层以往不是中国市场很繁荣的一类创业,但现在,早期就“闯全球”的项目越来越多。更多可能在打开。
曼祺_MatchQ
:
更新:昨天(美国时间16日)Anthropic 刚发布了 Claude Skills,也是一个 Agent 开发框架。可以把 Google、OpenAI、Anthropic 模型“御三家”的动作放一起对比看。
曼祺_MatchQ
:
图文版链接:https://mp.weixin.qq.com/s/u33843PaHJOcqcGEvAw2Fg shownotes 里也放了。
eloge
eloge
2025.10.18
这一期我是真的全靠通义转录+Gemini狂搜并给我讲解填补认知的沟壑才听下来的(毕竟很多agent项目和领域我都挺陌生的,并且中美差别挺大的,比如国内没什么能对标的composio)。所以还是真心希望能出文字稿,这期挺多干货的,比如那个印度公司靠着在X上发帖拿融资,真的好有趣。
Naomiiixia:好走心的评论!我们之后会努力更多分享有意思的公司!
曼祺_MatchQ
:
https://mp.weixin.qq.com/s/u33843PaHJOcqcGEvAw2Fg 图文版链接
4条回复
曼祺_MatchQ
曼祺_MatchQ
2025.10.18
更新:昨天(美国时间16日)Anthropic 刚发布了 Claude Skills,也是一个 Agent 开发框架。可以把 Google、OpenAI、Anthropic 模型“御三家”的动作放一起对比看。
Joes东:好像google ADK并没有那么多讨论
LincolnW
LincolnW
2025.10.18
质量非常高,想多听听大佬们的分享
吴远皓
吴远皓
2025.10.22
近三个月最有价值的ai 播客
WZL_B5l1
WZL_B5l1
2025.10.18
模型、生态、端侧。最终的AI王者一定是三个都要抓,三个都很硬的。因为基模没有办法形成可持续的壁垒,至少无法保证未来10年的稳定利润表。技术发展到现在,大家都开始尝试构建具有双边效应或者网络效应的护城河。做生态是最经典的,也是历史上最行之有效、保质期最长的一种壁垒。
Joes东
Joes东
2025.10.17
最近这两期质量真高👍
agihouse如果有被投企业的宣发需求,可以考虑北美播客佐治亚小帅asian answers
曼祺_MatchQ
曼祺_MatchQ
2025.10.20
图文版链接:https://mp.weixin.qq.com/s/u33843PaHJOcqcGEvAw2Fg
shownotes 里也放了。
黄一huangyi
黄一huangyi
2025.10.17
学习
mimimama-
mimimama-
2025.10.17
太多英文了🤦‍♂️ 坚持到这也是一堆听不懂的单词
Naomiiixia:第一次英文后面一句会紧跟中文解释一下。第一次接受中文媒体 很久不讲中文了,之后会多注意,谢谢反馈:)
曼祺_MatchQ
:
shownotes 附录里写了一部分解释。(确实以后多注意⛽️ 这个也会发文字的版本,我到时贴链接来
4条回复
干货真多👍 很少见,超级棒
一抹蕉蕉
一抹蕉蕉
2025.10.19
1:19:49 Agent observability
Z_zbtj
Z_zbtj
2025.10.28
57:10 这里说的语音的基础设施具体指的是什么呀
曼祺_MatchQ
:
比如前面提到了 LiveKit 有一部分像声网,最开始都是做 RTC,实时音视频通信。这个是我这里指的基础设施,就是它能提供一个低延迟的音视频传输网络,做这个业务的公司有重和轻不同的做法,比如声网,它前期是自建了节点网络,也有公司是租赁的。
Z_zbtj:get!感谢
洪钧AI
洪钧AI
2026.1.16
Letta 公司(原 MemGPT),一家专注于开发有状态智能体 (Stateful Agent) 技术的 AI 公司,其核心创新是 "睡眠时计算 (Sleep-time Compute)",让智能体在无用户请求时自主分析并生成标准 token 序列。
阿斯特罗
阿斯特罗
2025.12.27
这个naomi能不能别邀请了,总在堆砌词汇,像个ai吐词,全网洗稿,对谈完全不在一个维度🙄
bingo20
bingo20
2025.11.19
HD315764p
HD315764p
2025.11.05
主持人说话太像面试了,压迫感较高,ptsd
Randonee
Randonee
2025.10.18
这个女嘉宾说话像大模型