EP69 · 约束 Claude、AgentScope 工程化、上下文卸载 · 05-27 早报BestBlogs

EP69 · 约束 Claude、AgentScope 工程化、上下文卸载 · 05-27 早报

12分钟 ·
播放数40
·
评论数0

精讲一:我们如何在多个产品中约束 Claude

来自 Anthropic Engineering Anthropic 首度披露跨产品约束 Claude 的三种工程架构(临时容器 / HITL 沙盒 / 可信工作空间),并揭示关键教训:93% 的权限弹窗被无脑通过,自建代理层是最薄弱环节。核心结论:随 Agent 能力膨胀,靠环境隔离压缩爆炸半径比依赖人工审批更可靠。

精讲二:从透明开发到系统工程:AgentScope 2.0 发布

来自 通义大模型 AgentScope 2.0 从「可见调试」升级为生产级系统工程:引入权限系统(静态规则 + 动态审批)、稳定的模型重试与备用机制、结构化上下文管理、Middleware 扩展点以及统一 Workspace 抽象。阿里通义团队的核心判断:让 Agent 稳定跑完真实长链路任务,比能调用更多模型更重要。

精讲三:腾讯云 Agent Memory 节省 61% Token 提升 52%成功率的诀窍:Mermaid 无限画布×上下文卸载

来自 腾讯云开发者 腾讯云提出「上下文卸载 × Mermaid 无限画布」组合策略:完整任务信息卸载到外部文件系统,关键状态以结构化图谱形式高密度留存上下文。在超长 Session 实验中,最高节省 61% Token,任务通过率从 33% 提升至 50%(相对 +52%)。纯工程侧优化,无需微调模型。

速览

更多值得关注的内容

· 我用 7 天把 AI Agent 的 Token 账单砍掉 87%(附代码) — 高可用架构

· Vercel 如何将构建等待时间从 90 秒缩短至 5 秒 — ByteByteGo Newsletter

· Faire 通过 Cursor 云智能体将 PR 吞吐量翻倍 · Cursor — Cursor Blog

· 用括号来监管是一种糟糕的方式 — LessWrong — LessWrong

· Token 生意在重新洗牌 — 腾讯研究院

· 刚刚,国产 AI 自己造了 AI,全球首例! — 量子位

· AI 就业恐慌的现实检验 — MIT Technology Review

补充阅读

今天额外值得一读的几条

· 架构云原生 Kafka:从分层存储迈向无盘未来 — InfoQ

· Harness Engineering: C 端 AIGC 内容生产自优化实践 — 阿里云开发者

· Introducing Music v2, 突破性的全新音乐模型 — ElevenLabs Blog

· Google DeepMind 携手 OpenAI、ElevenLabs 和 Kakao,扩大 SynthID 水印应用 — Google DeepMind(@GoogleDeepMind)

· Microsoft Copilot Cowork 文件泄露漏洞 — Simon Willison's Weblog

· 教皇利奥十四世关于人工智能的通谕解读 — Simon Willison's Weblog

· AI 智能体正在悄然制造混沌工程故障,企业尚未察觉 — VentureBeat

· 创业者闭门探讨:Make for Agent ,其实还是 Make for Human — Founder Park

· 对话李开复:别叫我们 “六小虎”,叫 “金钱豹” — 晚点 - 最新报道

· 编程 Agent 可能是软件开发史上最昂贵的错误之一 — InfoQ 中文

· 具身智能的重复造轮子,终于有人开始认真解了 — 阑夕

· OpenAI 团队的零人工代码工作流深度解析 — Aakash Gupta(@aakashg0)

相关链接

· 我们如何在多个产品中约束 Claude:www.bestblogs.dev

· 从透明开发到系统工程:AgentScope 2.0 发布:www.bestblogs.dev

· 腾讯云 Agent Memory 节省 61% Token 提升 52%成功率的诀窍:Mermaid 无限画布×上下文卸载:www.bestblogs.dev

· 我用 7 天把 AI Agent 的 Token 账单砍掉 87%(附代码):www.bestblogs.dev

· Vercel 如何将构建等待时间从 90 秒缩短至 5 秒:www.bestblogs.dev

· Faire 通过 Cursor 云智能体将 PR 吞吐量翻倍 · Cursor:www.bestblogs.dev

· 用括号来监管是一种糟糕的方式 — LessWrong:www.bestblogs.dev

· Token 生意在重新洗牌:www.bestblogs.dev

· 刚刚,国产 AI 自己造了 AI,全球首例!:www.bestblogs.dev

· AI 就业恐慌的现实检验:www.bestblogs.dev

· 架构云原生 Kafka:从分层存储迈向无盘未来:www.bestblogs.dev

· Harness Engineering: C 端 AIGC 内容生产自优化实践:www.bestblogs.dev

· Introducing Music v2, 突破性的全新音乐模型:www.bestblogs.dev

· Google DeepMind 携手 OpenAI、ElevenLabs 和 Kakao,扩大 SynthID 水印应用:www.bestblogs.dev

· Microsoft Copilot Cowork 文件泄露漏洞:www.bestblogs.dev

· 教皇利奥十四世关于人工智能的通谕解读:www.bestblogs.dev

· AI 智能体正在悄然制造混沌工程故障,企业尚未察觉:www.bestblogs.dev

· 创业者闭门探讨:Make for Agent ,其实还是 Make for Human:www.bestblogs.dev

· 对话李开复:别叫我们 “六小虎”,叫 “金钱豹”:www.bestblogs.dev

· 编程 Agent 可能是软件开发史上最昂贵的错误之一:www.bestblogs.dev

· 具身智能的重复造轮子,终于有人开始认真解了:www.bestblogs.dev

· OpenAI 团队的零人工代码工作流深度解析:www.bestblogs.dev

关于 BestBlogs BestBlogs.dev 是 AI 驱动的私人阅读助手。它从 RSS、Newsletter、Twitter、YouTube、Podcast 等来源中筛选高质量内容,为关注技术、AI、产品、商业、研究、设计、投资、文化、个人成长等多元方向的读者整理每天真正适合自己的阅读流。

BestBlogs Pro 早鸟内测开放:关注你感兴趣的来源、配置兴趣标签,每天收到一份属于自己的「我的早报」,欢迎体验。

BestBlogs.dev · 发现真正适合你的高质量内容