精讲一:Erdős 突破:OpenAI 模型首次实现重大 AI 数学发现 [视频]
来自 OpenAI OpenAI 模型首次自主攻克了一个组合几何里的开放难题,被研究团队描述为 AI 从「辅助验证」跨向「原创发现」的分水岭。这道几何问题表面平凡、内部极为精细,需要在数千个微小战术决策之间做穿透式搜索;模型借助代数数论的结构性工具,找到了人类一直认为已是最优的构造之外的更优解。团队最初看到输出时连续几天反复核验,认为「太美好以至于不真实」,并坦言这条结果显著缩短了他们对 AI 自主科学发现到来时间表的预估。
精讲二:用 Claude Code Routines 构建主动式智能体工作流 [视频]
来自 Claude Anthropic 在开发者工作坊上发布 Claude Code Routines —— 把 Claude Code 从「敲指令才动」的被动工具升级为可在云端持续运行的主动智能体。Routines 直接跑在 Anthropic 托管的 serverless 环境,原生支持定时调度、GitHub 事件、Webhook 三种触发方式,运行中还能通过网页 / CLI / 桌面端实时查看进度、在中途下指令调整方向。Anthropic 自己的文档团队用一条 /schedule 命令就让 Routine 每周扫一遍 main 分支变更、自动产出文档 PR 并 Slack 通知团队,把工程师从守着 Agent 的「盯屏」工作里解放出来。
精讲三:从零重建 IT 架构:Serval CEO Jake Stauch 谈 AI 原生企业服务管理 [视频]
来自 Sequoia Capital Serval CEO Jake Stauch 与 Sequoia 详细复盘了 AI 原生企业 IT 的重塑路径:保留 ServiceNow 时代「数据库 + 工作流」的核心抽象,但把搭建过程从「点几小时拖拉拽」压缩成「用自然语言描述自动生成 TypeScript」。Stauch 给出的核心判断是:自动化的搭建必须比手动操作本身更简单,否则没人愿意切换。为对抗「slop 自动化」泛滥,Serval 用一个具备全局上下文的监管 Agent 帮 IT 管理员合并冗余流程;并把权限管控放在 Admin Agent 与 Help Desk Agent 的双层架构上 —— 应用层的真正护城河不在拼模型能力,而在为模型设边界、控权限、留审计。
速览
更多值得关注的内容
· 从 Prompt、Context 到 Harness,工程的三次进化与终局之战 — 腾讯云开发者
· 从 8B 到前沿:系统提示如何控制 AI 智能体是否会勒索、泄露和杀戮 — LessWrong — LessWrong
· Anthropic 销售负责人如何用 Claude Cowork 管理 4,000 个客户账户 | Claude — Claude Blog
· 人类和 AI Agent 的最佳配合方式,还没被发明|对谈 Paperboy [播客] — 十字路口 Crossing
· TLiveOmni 1.0: 直播视频多模态理解大模型 — 大淘宝技术
· OceanBase 封仲淹:Vibe Coding 只是开始,下一站是软件工厂 [播客] — AI 炼金术
· 软件公司的 AI 改造分级 L1-L4:从个人工具到经营重构(含真实案例拆解) — SaaS 白夜行
补充阅读
今天额外值得一读的几条
· 告别「盯屏守候」:Claude Code 高级自动化三层框架 [视频] — Claude
· Lovable 如何在大规模生产环境中实践 Vibe Coding [视频] — Claude
· Gemini 3.5 Flash:价格更高,但 Google 计划将其用于一切 — Simon Willison's Weblog
· 精通智能体技术:AI 智能体定制 — NVIDIA Technical Blog
· GitHub 正在调查内部仓库的未授权访问事件 — GitHub(@github)
· Claude Code Harness 工程:数仓侧落地方案|得物技术 — 得物技术
· 谷歌 AI 的 14 年、Gemini 翻身之战,与视觉理解模型:专访 DeepMind 前核心科学家 Andrew Dai|Neolabs 特辑 — 硅谷 101
· 7000 亿美元砸向 AI:这是下一代互联网,还是泡沫重演?| S10E12 [播客] — What's Next|科技早知道
· Gemini Omni:Google 发布原生多模态视频生成模型 — meng shao(@shao__meng)
· Gavin Baker 深度解析:轨道计算、台积电与 AI 前沿模型的投资逻辑 [视频] — Invest Like The Best
相关链接
· Erdős 突破:OpenAI 模型首次实现重大 AI 数学发现 [视频]:www.bestblogs.dev
· 用 Claude Code Routines 构建主动式智能体工作流 [视频]:www.bestblogs.dev
· 从零重建 IT 架构:Serval CEO Jake Stauch 谈 AI 原生企业服务管理 [视频]:www.bestblogs.dev
· 从 Prompt、Context 到 Harness,工程的三次进化与终局之战:www.bestblogs.dev
· 从 8B 到前沿:系统提示如何控制 AI 智能体是否会勒索、泄露和杀戮 — LessWrong:www.bestblogs.dev
· Anthropic 销售负责人如何用 Claude Cowork 管理 4,000 个客户账户 | Claude:www.bestblogs.dev
· 人类和 AI Agent 的最佳配合方式,还没被发明|对谈 Paperboy [播客]:www.bestblogs.dev
· TLiveOmni 1.0: 直播视频多模态理解大模型:www.bestblogs.dev
· OceanBase 封仲淹:Vibe Coding 只是开始,下一站是软件工厂 [播客]:www.bestblogs.dev
· 软件公司的 AI 改造分级 L1-L4:从个人工具到经营重构(含真实案例拆解):www.bestblogs.dev
· 告别「盯屏守候」:Claude Code 高级自动化三层框架 [视频]:www.bestblogs.dev
· Lovable 如何在大规模生产环境中实践 Vibe Coding [视频]:www.bestblogs.dev
· Gemini 3.5 Flash:价格更高,但 Google 计划将其用于一切:www.bestblogs.dev
· 精通智能体技术:AI 智能体定制:www.bestblogs.dev
· GitHub 正在调查内部仓库的未授权访问事件:www.bestblogs.dev
· Claude Code Harness 工程:数仓侧落地方案|得物技术:www.bestblogs.dev
· 谷歌 AI 的 14 年、Gemini 翻身之战,与视觉理解模型:专访 DeepMind 前核心科学家 Andrew Dai|Neolabs 特辑:www.bestblogs.dev
· 7000 亿美元砸向 AI:这是下一代互联网,还是泡沫重演?| S10E12 [播客]:www.bestblogs.dev
· Gemini Omni:Google 发布原生多模态视频生成模型:www.bestblogs.dev
· Gavin Baker 深度解析:轨道计算、台积电与 AI 前沿模型的投资逻辑 [视频]:www.bestblogs.dev
关于 BestBlogs BestBlogs.dev 是 AI 驱动的私人阅读助手。它从 RSS、Newsletter、Twitter、YouTube、Podcast 等来源中筛选高质量内容,为关注技术、AI、产品、商业、研究、设计、投资、文化、个人成长等多元方向的读者整理每天真正适合自己的阅读流。
BestBlogs Pro 早鸟内测开放:关注你感兴趣的来源、配置兴趣标签,每天收到一份属于自己的「我的早报」。欢迎体验,把反馈发回给我们:bestblogs.dev

