EP85 · 智能体解耦、Harness 自律、脚手架被吞 · 06-12 早报BestBlogs

EP85 · 智能体解耦、Harness 自律、脚手架被吞 · 06-12 早报

13分钟 ·
播放数44
·
评论数0

智能体交互界面的演进:使用 Claude Managed Agents 进行构建 | Claude

来自 Claude Blog Anthropic 推出 Claude Managed Agents,把智能体的「大脑」(推理循环)和「双手」(代码执行沙箱)彻底解耦,靠可恢复的事件日志连接两端:凭证统一存进独立的 Vault,绝不暴露给生成的代码,自托管沙箱还能让代码留在企业内网,首字延迟中位数降低六成、长尾降低九成以上,Notion、Sentry、Rakuten 等都已在生产环境跑通。

AI 不缺智商缺纪律:一场 Harness 工程化实践

来自 阿里技术 一位阿里工程师复盘两个月的 AI Harness 演进:从把所有规则堆进 CLAUDE.md 导致「读完规则没脑容量读代码」,到三层加载架构 + dispatcher 状态机 + 文件交接 + G1-G8 门禁,再用 7 维确定性评分给每次改动打分,结论是「用更好的结构约束 AI,而不是用更多的字」。

Google DeepMind 的 Logan Kilpatrick:为什么模型会吞掉智能体脚手架 [视频]

来自 Sequoia Capital Google DeepMind 的 Logan Kilpatrick 在 Sequoia 访谈中提出「模型吞掉脚手架」:路由、执行环境这类原本搭在外层的工程能力正被模型本身逐步吸收,Gemini 3.5 Flash 的编程能力提升完全来自后训练;他认为随着基础模型不断「吃掉」周边脚手架,独立创业公司的出路只剩垂直领域的深度专精。

速览

更多值得关注的内容

· 为什么 AI 还没有取代软件工程师,而且也不会 — AI as Normal Technology

· 云原生 - AI Native 多智能体数字人架构实践 — 阿里云开发者

· 端侧 AI 提速 80%?如何让 Qwen3-VL 在手机起飞 — 通义实验室

· 人是最慢的节点,还怎么管 AI Agent?|AI 跃迁者调研 — 腾讯研究院

· Fable AI 实现 1770% 性能提升并发现关键 Bug:我的个人奇点时刻 — Taelin(@VictorTaelin)

· CFO 的自白:为什么你的加薪变成了 GPU — Peter Girnus 🦅(@gothburz)

· “无招” 没变,但 AI 改变了公司和人才的权力关系 — 晚点 LatePost

相关链接

· 本期早报在线阅读:www.bestblogs.dev

· 智能体交互界面的演进:使用 Claude Managed Agents 进行构建 | Claude:www.bestblogs.dev

· AI 不缺智商缺纪律:一场 Harness 工程化实践:www.bestblogs.dev

· Google DeepMind 的 Logan Kilpatrick:为什么模型会吞掉智能体脚手架 [视频]:www.bestblogs.dev

· 为什么 AI 还没有取代软件工程师,而且也不会:www.bestblogs.dev

· 云原生 - AI Native 多智能体数字人架构实践:www.bestblogs.dev

· 端侧 AI 提速 80%?如何让 Qwen3-VL 在手机起飞:www.bestblogs.dev

· 人是最慢的节点,还怎么管 AI Agent?|AI 跃迁者调研:www.bestblogs.dev

· Fable AI 实现 1770% 性能提升并发现关键 Bug:我的个人奇点时刻:www.bestblogs.dev

· CFO 的自白:为什么你的加薪变成了 GPU:www.bestblogs.dev

· “无招” 没变,但 AI 改变了公司和人才的权力关系:www.bestblogs.dev

关于 BestBlogs BestBlogs 是 AI 驱动的私人阅读助手,帮助你建立稳定、可信、个性化的高质量信息输入。 它帮你判断什么值得读、协助你读懂,并逐渐理解你关注什么。

关注你感兴趣的来源和主题,每天生成一份更适合自己的「我的早报」。 欢迎体验并反馈:www.bestblogs.dev

在线阅读:www.bestblogs.dev

BestBlogs.dev · 发现真正适合你的高质量内容