精讲一:Benedict Evans 谈 AI 的真实走向:平台迁移、劳动变化与价值归属 [视频]
来自 Lenny's Podcast 前 a16z 分析师 Benedict Evans 以「1997 年互联网」类比当下 AI 现状:基础模型实验室正疯狂招募麦肯锡式专业服务团队,恰恰说明企业 AI 落地远非一键完成。他援引杰文斯悖论——电子表格普及后会计师反而增多——反驳「AI 消灭就业」论,并以电信行业商品化为镜断言:基础模型利润将趋零,真正的长期价值将沉淀在分发渠道与应用层,而非底层模型厂商。
精讲二:删除 95% 的 Agent Skills 后,WorkOS 如何让智能体结果变好 [视频]
来自 AI Engineer WorkOS 工程师 Nick Nisi 停止手写代码已 8 个月,用 Agent 管理 20+ 个多语言仓库。他发现一条反直觉定律:把 Skills 从 1 万行削减到仅 553 行「只写坑点」后,单次评估时间从 68 分钟降到 6 分钟,准确率从 77% 升至 97%。此外用 SHA-256 哈希验证测试日志,彻底杜绝 Agent「假报通过」。三条核心原则:用代码约束取代口头指令、只标注地雷而非逐步照本宣科、以真实通过率度量而非相信声称。
精讲三:构建智能体,而非管道
来自 Sean Goedecke Sean Goedecke 厘清了 LLM 程序的两条根本路线:管道(代码定义控制流)与智能体(LLM 自主控制流)。核心结论:凡任务复杂到需要推理模型,就应该选 Agent——它能动态获取所需上下文,彻底绕开「RAG 检索」这个至今未解的技术难题。管道胜在可预测和成本可控,但智能体在上下文采集阶段天然占优,这也解释了为何 Claude Code、Codex 等所有顶级 AI 编码产品全部选择 Agent 架构。
速览
更多值得关注的内容
· 一周 3.3k star,微软开启 Skills 自我进化!像训练神经网络一样训练技能 — 机器之心
· AI 原生时代下,让世界适应 Agent,而非教 AI 做人 | 港大黄超@AIGC2026 — 量子位
· 进展如何?语言模型中的强化学习招募了一条功能性福利轴 — LessWrong — LessWrong
· 「Token」必须死? — 36 氪
· 蚂蚁三代 CTO 闭门对话:周期穿越、技术决策与 AI-Native 组织 — InfoQ 中文
· Chatbase 如何在 AI 时代不融资做到 1000 万美元 ARR:Yasser Elsaid 的增长实战 [视频] — EO
· 解决方案或许是取消我的 AI 订阅 — Simon Willison's Weblog
补充阅读
今天额外值得一读的几条
· 七年时间窗口的护城河:为什么耐心是你的竞争优势 — Garry Tan(@garrytan)
· 比 YOLO 更安全:主机执行审批的自动模式 — OpenClaw Blog
· τ0-WM:最大规模预训练的开源具身世界模型来了 — 量子位
· MiMo-V2.5 系列推理全链路优化:将 Hybrid SWA 效率推向极致 — Xiaomi MiMo
· 别光给 Agent 加 Tool 了,它根本选不明白!复旦×通义提出全新 CUA 训练范式 — 量子位
· Rubrics 综述:Agent 时代,如何定义一个「好答案」? — 机器之心
· OpenAI 的“护栏”系统:产品经理无需工程师写代码,即可交付超过 10 万行代码 — Aakash Gupta(@aakashg0)
· DuckDB Quack:基于 HTTP 的客户端/服务器协议,实现多用户分析 — InfoQ
· #563. “什么事都不会发生”结束了:纳瓦尔谈 AI、组织、硬件与不理性的乐观 [播客] — 跨国串门儿计划
相关链接
· Benedict Evans 谈 AI 的真实走向:平台迁移、劳动变化与价值归属 [视频]:www.bestblogs.dev
· 删除 95% 的 Agent Skills 后,WorkOS 如何让智能体结果变好 [视频]:www.bestblogs.dev
· 构建智能体,而非管道:www.bestblogs.dev
· 一周 3.3k star,微软开启 Skills 自我进化!像训练神经网络一样训练技能:www.bestblogs.dev
· AI 原生时代下,让世界适应 Agent,而非教 AI 做人 | 港大黄超@AIGC2026:www.bestblogs.dev
· 进展如何?语言模型中的强化学习招募了一条功能性福利轴 — LessWrong:www.bestblogs.dev
· 「Token」必须死?:www.bestblogs.dev
· 蚂蚁三代 CTO 闭门对话:周期穿越、技术决策与 AI-Native 组织:www.bestblogs.dev
· Chatbase 如何在 AI 时代不融资做到 1000 万美元 ARR:Yasser Elsaid 的增长实战 [视频]:www.bestblogs.dev
· 解决方案或许是取消我的 AI 订阅:www.bestblogs.dev
· 七年时间窗口的护城河:为什么耐心是你的竞争优势:www.bestblogs.dev
· 比 YOLO 更安全:主机执行审批的自动模式:www.bestblogs.dev
· τ0-WM:最大规模预训练的开源具身世界模型来了:www.bestblogs.dev
· MiMo-V2.5 系列推理全链路优化:将 Hybrid SWA 效率推向极致:www.bestblogs.dev
· 别光给 Agent 加 Tool 了,它根本选不明白!复旦×通义提出全新 CUA 训练范式:www.bestblogs.dev
· Rubrics 综述:Agent 时代,如何定义一个「好答案」?:www.bestblogs.dev
· OpenAI 的“护栏”系统:产品经理无需工程师写代码,即可交付超过 10 万行代码:www.bestblogs.dev
· DuckDB Quack:基于 HTTP 的客户端/服务器协议,实现多用户分析:www.bestblogs.dev
· #563. “什么事都不会发生”结束了:纳瓦尔谈 AI、组织、硬件与不理性的乐观 [播客]:www.bestblogs.dev
关于 BestBlogs BestBlogs.dev 是 AI 驱动的私人阅读助手。它从 RSS、Newsletter、Twitter、YouTube、Podcast 等来源中筛选高质量内容,为关注技术、AI、产品、商业、研究、设计、投资、文化、个人成长等多元方向的读者整理每天真正适合自己的阅读流。
BestBlogs Pro 早鸟内测开放:关注你感兴趣的来源、配置兴趣标签,每天收到一份属于自己的「我的早报」。欢迎体验:bestblogs.dev

