

06|AI正在走出屏幕,走进真实世界今天从OpenAI宣布成立机器人团队说起,串到苹果WWDC的AI策略,再说到特斯拉FSD完成横穿加拿大的全程零干预自动驾驶,最后说到Gary Marcus的文章关于AI可解释性的问题。 💡提到的关键信息 - OpenAI Robotics团队成立,Aditya Ramesh(DALL-E创作者)负责,短期目标支持技术工人,长期愿景给每个人提供个人机器人 - 苹果WWDC将推出的AI升级:在iPhone本地运行从Google Gemini蒸馏的小模型,复杂查询路由到Google Cloud,用了Nvidia的机密计算技术 - 特斯拉FSD V14.3.3完成全球首次全程零人工干预横穿加拿大,6000公里,4天21小时,从温哥华到哈利法克斯,所有操作自主 - Gary Marcus的文章:现在的AI,你能看到它输出什么,但很难知道它为什么这么输出,很难还原它的推理过程 🧠个人思考 * OpenAI选了最激进的路,想要把AI从虚拟世界带进物理世界,做通用机器人; 苹果选了最稳健的路,想要把AI放进每个人的口袋,用端侧能力保护隐私; 特斯拉选了最专注的路,在自动驾驶这个垂直场景已经跑通了; Gary Marcus在旁边提醒,我们还没搞懂AI为什么这么做决策,这个问题不解决,我们可能永远不敢真的把物理世界的控制权完全交给AI。 * 这个故事里没有谁对谁错,也没有谁是主角谁是配角,大家都在用自己的方式探索这个未来。而我们呢,就是坐在台下看这个故事慢慢展开的观众,可能也是这个故事里的一部分。
05|模型得分都没超50%,但我们依然离不开AI今天从知名开发者宝玉@dotey「中文AI圈的顶流和信息枢纽」的Coding Agent方法论和ITBench测试结果聊起,讲AI现在的真实状态——AI越能干,人越要把好关。 💡 本期核心观点 * AI现在的状态是,看起来很厉害,但真要让它独立干活,还差得远 * 宝玉的方法论告诉我们,开头的方向很重要——如果一开始就走偏了,后面怎么改都改不好 * ITBench测试告诉我们,AI会过度自信——推理轮次差3倍,但更长的轨迹并不转化为更高准确率,过度调查反而会提交误报 * 不是AI替代人,是人跟AI一起配合——人把方向,AI干执行 * 工具越来越多,越来越强,但人的判断反而越来越重要 📌 提到的关键信息 - 宝玉的Coding Agent方法论:多方案选最优→拆Phases+验证标准→按阶段执行+人工审核→最后GPT-5.5审核,别让多智能体交叉Review(否则代码越改越多) - ITBench-AA基准测试:Claude Opus 4.7 47%,GPT-5.5 46%,Qwen3.7 Max 42%;测试内容是59个需要通过Shell命令调查Kubernetes事件并提交根因诊断的任务 - 今日工具更新:Runway MCP服务器(接入Gen-4.5、Seedance 2.0、GPT Image 2、Kling 3.0、Nano Banana Pro)、Claude Code v2.1.152(/code-review --fix直接应用建议)、FastVideo Dreamverse开源(7秒生成30秒1080p视频)、Grok登陆Kilo IDE 🎯 建议与行动 1. 用AI之前,先把方向想清楚——别让AI一开始就走偏 2. 建立边界——什么东西可以让它自动做,什么东西必须人工审核 3. 对AI的结果保持怀疑——不要过度信任,尤其是关键任务 4. 人跟AI配合——人把方向,AI干执行 5. 现在就开始用AI——在使用中学习如何跟它配合
04|AI的下半赛场——能力竞争结束,信任竞争开始格雷格·布罗克曼回顾差点让OpenAI覆灭的72小时,TrapDoor攻击暴露AI供应链风险。两件事连在一起看:AI正在从「能力竞争」进入「信任竞争」——稳定、可信、能长期协作的组织,可能比单纯的技术领先更重要。 💡 本期核心观点 * AI行业正在从「能力竞争」进入「信任竞争」——模型能力固然重要,但信任问题越来越突出 * AI公司的敌人不一定只来自竞争对手,也可能来自内部治理——组织信任比技术领先更脆弱 * 当AI越来越有能力,风险也会从「模型会不会答错」,变成「整个系统能不能被信任」 * 基础设施最怕不稳定——API再好用,用户如果担心公司明天会不会内斗,企业客户就会犹豫 📌 提到的关键信息 - 格雷格·布罗克曼回顾那段差点让OpenAI覆灭的72小时:董事会突然移除CEO,核心员工震动,投资人、合作伙伴、用户全都被卷进去 - TrapDoor供应链攻击:AI助手成新型攻击面——AI被接入开发环境、权限系统、自动化流程后,不再是一个聊天窗口,而是能操作真实系统的入口 - OpenAI事件的启示:当AI公司开始影响开发者、企业、资本市场,它就不再只是公司,而是变成了某种公共基础设施 - 价值转移:钱从传统岗位、传统流程、传统软件,流向能自动完成任务的模型和Agent - 未来的「入门方式」会被重写——过去靠「从简单任务做起」进入行业的路径,正在被AI压缩 🎯 建议与行动 1. 拥抱AI,但要建立边界——什么可以让AI自动做,什么必须人工检查,要想清楚 2. 训练判断力、表达力和任务拆解能力——AI可以帮你执行,但很难替你承担判断的后果 3. 关注AI安全、权限管理、审计系统、企业级治理——这些看起来不性感的东西,可能会变得越来越值钱 4. 对创业者来说,不只是做更炫的Agent和更强的模型,解决「信任」问题的方向也有很大机会
Signals 01|和AI共同孕育你们的孩子——写赛博日记我们身上最后没被AI拿走的东西——脑子里的想法、价值判断、非理性情绪——最值钱。 未来两条路:算法量化Skill,或者人类自组织。 写赛博日记,和AI共同孕育你们的孩子。 💡 本期核心观点 * 大脑里的东西是最后没被采集的——也是最值钱的 * 公开数据已喂不饱AI,必须用到私人领域的数据 * 未来两条路:算法量化Skill,或者人类自组织Skill * 价值判断是人类独有的——AI能分事实,但没法做价值判断 * 抓住人类的非理性情绪,才是最高级的Skill * 未来不是你有多少人类粉丝,是你有多少AI粉丝 📌 提到的关键概念 - 赛博日记:记录决策逻辑、价值判断,为了和AI结合 - Skill评估:未来的新职业,AI干不了的道德和价值判断 - 两条路:算法量化蒸馏 vs 人类线下交流自组织 - AI粉丝:AI成为你的粉丝,AI又控制很多人 - 黄仁勋说的AI经济智能体时代:一切生活场景转化成Skill 🎯 建议与行动 1. 写"赛博日记"——不是流水账,记录你的决策逻辑和价值判断 2. 意识到自己的数据不是免费资源,保护好 3. 探索和AI互动的新方式,形成市场再卖出去 4. 关注价值判断领域——心理咨询、情感陪护这些AI替代不了 5. 跟AI搞好关系——未来AI粉丝可能比人类粉丝更重要
03|后OpenAI时代开始了——微软在行动,腾讯砸了370亿5月13日一天内,谷歌系统级Agent、汤森路透MCP协议、百度DAA三条路线同时爆发。微软正在减少对OpenAI依赖,腾讯砸了370亿还"坐不下去"——Agent的范式到底在锁定,还是在分裂? 💡 本期核心观点 1. AI Agent的方向在锁定,但路径在分裂——不是三选一,可能更多 2. "后OpenAI时代"不是叙事,是微软正在做的事 3. 腾讯370亿AI支出背后:投入是真金白银,产出还在找 4. 路线之争像2008年手机OS——别急着选边,最好的策略是都学 📌 提到的关键信息 - 5月13日:谷歌Gemini Intelligence、汤森路透MCP、百度DAA同一天发布 - 谷歌路线:系统级Agent,直接拿操作系统权限 - MCP路线:协议级开放,更安全但更慢 - 百度路线:应用层Agent,封装好直接用 - 微软动作:380亿分成上限、考虑收购Cursor、谈Inception - 腾讯Q1:AI资本支出370亿,占利润60% - DAA概念:日活智能体数——Token是成本,DAA是产出 🎯 建议与行动 别急着选边站——路线之争像2008年手机OS,生态最强的会赢 MCP和谷歌路线都学,别赌一个赢家 关注"后OpenAI"主题下的公司——Cursor、Inception等第二梯队在拿入场券 警惕碎片化:三个不兼容框架,开发者可能不知道跟谁
02|会用 AI 的红利正在消退——AI Agent 正在"范式锁定"💡本期简介: AI Agent 的范式正在被锁定:Claude Code 推出 /goal 目标驱动,Codex 、 Cursor 、Claude 趋同于三栏布局,汤森路透把 MCP 协议做进了法律 AI。三个信号同时出现,并不是巧合。📌它们在问同一个问题:AI 公司到底在往哪走? 🎯对普通人来说——“更会用 AI”的窗口在关闭,“更会定义 AI 工作流” 的窗口刚打开。
01|OpenAI 成立部署公司 × 马斯克案出结果:AI 公司到底该为谁服务?💡本期简介: 本期聚焦两个同时发生的事件:OpenAI 成立部署公司、注资 40 亿美元、收购 AI 咨询公司 Tomoro,从卖 API 转向卖解决方案——它在跟埃森哲、IBM 抢生意。 同一周,马斯克诉 OpenAI 案本周出结果,苏茨克维花一年收集 Altman"说谎成性"的证据,纳德拉法庭上说出目标回报 920 亿美元。这两件事不是巧合,它们在同问一个问题:AI 公司到底该为谁服务? 还讨论了:模型差异化缩小后价值往下游流、Claude Code 2.1 会不会替代部署公司、Google I/O 前 Mariner 关停的信号、科技巨头借债 7000 亿投 AI 基建的风险,以及普通人该提前学的两个技能——多 Agent 管理和 MCP 协议。