EP61 · Composer 2.5 / 长时间 Agent / AI 生码率 · 05.19 早报Gino Notes

EP61 · Composer 2.5 / 长时间 Agent / AI 生码率 · 05.19 早报

13分钟 ·
播放数50
·
评论数0

今日精讲

Cursor 发布 Composer 2.5:基于 Kimi K2.5 的智能升级

Cursor 发布 Composer 2.5,基于 Moonshot Kimi K2.5 开源 checkpoint,引入 textual feedback RL(在 rollout 关键节点插入文本提示作教师信号)+ 25 倍合成任务规模。新模型显著提升长任务持续工作能力和指令遵循度,价格 0.50/2.50 美元每 M token,首周双倍额度。同时联合 SpaceXAI 用 Colossus 2 训练新一代模型 —— 交付节奏正在从产品迭代切换到模型迭代。 来自 Cursor Blog

构建能持续运行数小时的智能体:Anthropic 工程师揭秘对抗式生成 - 评估架构 [视频]

Anthropic Applied AI 团队 Ash Prabaker 和 Andrew Wilson 在 AI Engineer 大会拆解长时间 Agent 工程:长 session 三大失败是 context rot、规划缺陷、输出 sycophancy。最佳实践是类 GAN 的 generator-evaluator 对抗架构 —— 宏观规划器、代码生成器、Playwright 视觉评审器通过磁盘 markdown 协商契约。Opus 3.7 的 1 小时被 Opus 4.6 的 12 小时取代,6 小时连续会话能造出带物理引擎的游戏。核心结论:self-evaluation 是 trap,必须独立 critic。 来自 AI Engineer

CIO 正在抛弃 AI 生码率:一场关于什么才算产研提效的实践复盘

阿里云 CIO 蒋林泉 2026 财年硬数据:前端人均有效代码量翻 3 倍、后端翻 2 倍,千行代码缺陷率前端降 30%、后端降 55% —— 但他从开始就拒绝把「AI 生码率」纳入考核。理由:编码只占软件工程 20% 时间,AI 生码率衡量的恰好是「最容易被替代、价值密度最低」那一段。给企业的两个判断:「代码一定是负债,可能是资产」「Vibe Coding 不直接上生产,要用 AI 辅助的软件工程」。 来自 InfoQ 中文

速览

更多值得关注的内容

· 重新定义 Skill 开发:保姆级教程&一站式开发助手发布 — 阿里云开发者

· RAG 全链路技术详解 — 大淘宝技术

· 从 0 开发大模型的 17 种 Agent 架构演进详细拆解 — 腾讯技术工程

· 深入探索 MCP 与 Spring AI:从协议核心到企业级生产部署全链路指南 [视频] — Spring I/O

· Anthropic 创始人手册:AI Native 公司,正在把「几个人做几百人的事」变成现实 — AINLP

· AI 收入集中度创新高:Anthropic 与 OpenAI 吞下 89% 份额 — 腾讯科技

· Anthropic 收购 Stainless:整合 SDK 与 MCP 服务器平台 — Anthropic(@AnthropicAI)

相关链接

· Cursor 发布 Composer 2.5:基于 Kimi K2.5 的智能升级:www.bestblogs.dev

· 构建能持续运行数小时的智能体:Anthropic 工程师揭秘对抗式生成 - 评估架构 [视频]:www.bestblogs.dev

· CIO 正在抛弃 AI 生码率:一场关于什么才算产研提效的实践复盘:www.bestblogs.dev

· 重新定义 Skill 开发:保姆级教程&一站式开发助手发布:www.bestblogs.dev

· RAG 全链路技术详解:www.bestblogs.dev

· 从 0 开发大模型的 17 种 Agent 架构演进详细拆解:www.bestblogs.dev

· 深入探索 MCP 与 Spring AI:从协议核心到企业级生产部署全链路指南 [视频]:www.bestblogs.dev

· Anthropic 创始人手册:AI Native 公司,正在把「几个人做几百人的事」变成现实:www.bestblogs.dev

· AI 收入集中度创新高:Anthropic 与 OpenAI 吞下 89% 份额:www.bestblogs.dev

· Anthropic 收购 Stainless:整合 SDK 与 MCP 服务器平台:www.bestblogs.dev

BestBlogs Pro 早鸟内测开放:你可以自定义订阅源、配置兴趣标签,每天获得一份属于自己的头条早报。欢迎抢先体验:bestblogs.dev