EP74 · AI 价值归宿、Skills 极简法、Agent 胜管道 · 06-01 早报BestBlogs

EP74 · AI 价值归宿、Skills 极简法、Agent 胜管道 · 06-01 早报

13分钟 ·
播放数54
·
评论数0

精讲一:Benedict Evans 谈 AI 的真实走向:平台迁移、劳动变化与价值归属 [视频]

来自 Lenny's Podcast 前 a16z 分析师 Benedict Evans 以「1997 年互联网」类比当下 AI 现状:基础模型实验室正疯狂招募麦肯锡式专业服务团队,恰恰说明企业 AI 落地远非一键完成。他援引杰文斯悖论——电子表格普及后会计师反而增多——反驳「AI 消灭就业」论,并以电信行业商品化为镜断言:基础模型利润将趋零,真正的长期价值将沉淀在分发渠道与应用层,而非底层模型厂商。

精讲二:删除 95% 的 Agent Skills 后,WorkOS 如何让智能体结果变好 [视频]

来自 AI Engineer WorkOS 工程师 Nick Nisi 停止手写代码已 8 个月,用 Agent 管理 20+ 个多语言仓库。他发现一条反直觉定律:把 Skills 从 1 万行削减到仅 553 行「只写坑点」后,单次评估时间从 68 分钟降到 6 分钟,准确率从 77% 升至 97%。此外用 SHA-256 哈希验证测试日志,彻底杜绝 Agent「假报通过」。三条核心原则:用代码约束取代口头指令、只标注地雷而非逐步照本宣科、以真实通过率度量而非相信声称。

精讲三:构建智能体,而非管道

来自 Sean Goedecke Sean Goedecke 厘清了 LLM 程序的两条根本路线:管道(代码定义控制流)与智能体(LLM 自主控制流)。核心结论:凡任务复杂到需要推理模型,就应该选 Agent——它能动态获取所需上下文,彻底绕开「RAG 检索」这个至今未解的技术难题。管道胜在可预测和成本可控,但智能体在上下文采集阶段天然占优,这也解释了为何 Claude Code、Codex 等所有顶级 AI 编码产品全部选择 Agent 架构。

速览

更多值得关注的内容

· 一周 3.3k star,微软开启 Skills 自我进化!像训练神经网络一样训练技能 — 机器之心

· AI 原生时代下,让世界适应 Agent,而非教 AI 做人 | 港大黄超@AIGC2026 — 量子位

· 进展如何?语言模型中的强化学习招募了一条功能性福利轴 — LessWrong — LessWrong

· 「Token」必须死? — 36 氪

· 蚂蚁三代 CTO 闭门对话:周期穿越、技术决策与 AI-Native 组织 — InfoQ 中文

· Chatbase 如何在 AI 时代不融资做到 1000 万美元 ARR:Yasser Elsaid 的增长实战 [视频] — EO

· 解决方案或许是取消我的 AI 订阅 — Simon Willison's Weblog

补充阅读

今天额外值得一读的几条

· 七年时间窗口的护城河:为什么耐心是你的竞争优势 — Garry Tan(@garrytan)

· 比 YOLO 更安全:主机执行审批的自动模式 — OpenClaw Blog

· τ0-WM:最大规模预训练的开源具身世界模型来了 — 量子位

· MiMo-V2.5 系列推理全链路优化:将 Hybrid SWA 效率推向极致 — Xiaomi MiMo

· 别光给 Agent 加 Tool 了,它根本选不明白!复旦×通义提出全新 CUA 训练范式 — 量子位

· Rubrics 综述:Agent 时代,如何定义一个「好答案」? — 机器之心

· OpenAI 的“护栏”系统:产品经理无需工程师写代码,即可交付超过 10 万行代码 — Aakash Gupta(@aakashg0)

· DuckDB Quack:基于 HTTP 的客户端/服务器协议,实现多用户分析 — InfoQ

· #563. “什么事都不会发生”结束了:纳瓦尔谈 AI、组织、硬件与不理性的乐观 [播客] — 跨国串门儿计划

相关链接

· Benedict Evans 谈 AI 的真实走向:平台迁移、劳动变化与价值归属 [视频]:www.bestblogs.dev

· 删除 95% 的 Agent Skills 后,WorkOS 如何让智能体结果变好 [视频]:www.bestblogs.dev

· 构建智能体,而非管道:www.bestblogs.dev

· 一周 3.3k star,微软开启 Skills 自我进化!像训练神经网络一样训练技能:www.bestblogs.dev

· AI 原生时代下,让世界适应 Agent,而非教 AI 做人 | 港大黄超@AIGC2026:www.bestblogs.dev

· 进展如何?语言模型中的强化学习招募了一条功能性福利轴 — LessWrong:www.bestblogs.dev

· 「Token」必须死?:www.bestblogs.dev

· 蚂蚁三代 CTO 闭门对话:周期穿越、技术决策与 AI-Native 组织:www.bestblogs.dev

· Chatbase 如何在 AI 时代不融资做到 1000 万美元 ARR:Yasser Elsaid 的增长实战 [视频]:www.bestblogs.dev

· 解决方案或许是取消我的 AI 订阅:www.bestblogs.dev

· 七年时间窗口的护城河:为什么耐心是你的竞争优势:www.bestblogs.dev

· 比 YOLO 更安全:主机执行审批的自动模式:www.bestblogs.dev

· τ0-WM:最大规模预训练的开源具身世界模型来了:www.bestblogs.dev

· MiMo-V2.5 系列推理全链路优化:将 Hybrid SWA 效率推向极致:www.bestblogs.dev

· 别光给 Agent 加 Tool 了,它根本选不明白!复旦×通义提出全新 CUA 训练范式:www.bestblogs.dev

· Rubrics 综述:Agent 时代,如何定义一个「好答案」?:www.bestblogs.dev

· OpenAI 的“护栏”系统:产品经理无需工程师写代码,即可交付超过 10 万行代码:www.bestblogs.dev

· DuckDB Quack:基于 HTTP 的客户端/服务器协议,实现多用户分析:www.bestblogs.dev

· #563. “什么事都不会发生”结束了:纳瓦尔谈 AI、组织、硬件与不理性的乐观 [播客]:www.bestblogs.dev

关于 BestBlogs BestBlogs.dev 是 AI 驱动的私人阅读助手。它从 RSS、Newsletter、Twitter、YouTube、Podcast 等来源中筛选高质量内容,为关注技术、AI、产品、商业、研究、设计、投资、文化、个人成长等多元方向的读者整理每天真正适合自己的阅读流。

BestBlogs Pro 早鸟内测开放:关注你感兴趣的来源、配置兴趣标签,每天收到一份属于自己的「我的早报」。欢迎体验:bestblogs.dev