

11.美国断供最强人工智能Fable本集深度简介 Anthropic万众瞩目的Fable 5模型上线72小时就被政府强制下架,这场drama从Mythos的公关造势一路演到全球禁令。我们从亲手实测说起:max计划跑refactor的task,跑到一半token耗尽,等下一个session接着跑——结论是没找到任何一个非它不可的场景。 真正的暗坑在于"降智"被写进了说明书:Anthropic fable 5加了router,把它判定为有风险的task偷偷降到Opus跑,却照样按最贵的价格收费。从产品角度这就是欺诈。用一个好模型当funnel,把便宜模型高价卖出去,消费者完全失去control,最初连什么时候降了智都不知道。Lewis用Gemini时期的经验拆解了这套逻辑:质量与价格的tradeoff该不该扔给用户决定,以及"不记录用户数据"这条信任红线一旦迈出去就再也收不回来。 更深一层是访问平权问题:谁有资格用最强的智能?标榜"让所有人用上AI"的公司,真正部署时却按护照、企业和个人来分发?这就是AI霸权。再叠加企业数据从零留存被强改成30天留存、微软直接停用,所有CEO都被迫意识到:核心业务不能rent在别人的AI上,开源模型成了唯一的解。两人也顺势聊到中国开源模型靠数据优势长期可能反超,以及黑市上一条用户trace只卖10美元的灰色产业链。 时间线索引 00:00 实测跑到一半没token 03:04 降智被写进说明书 06:38 用户数据是信任红线 08:47 谁有资格访问最强智能 11:10 政府禁令的真实动机 15:05 30天数据留存 31:51 开源模型的数据优势 37:15 上周趣闻 我们聊到的话题 * Anthropic道歉降智 (https://x.com/ClaudeDevs ) * OpenAI推迟2027上市 (https://www.reuters.com/business/openai-expects-go-public-within-next-year-information-reports-2026-06-10/ ) * SpaceX上市招股书 (https://www.sec.gov/Archives/edgar/data/1181412/000162828026036936/spaceexplorationtechnologi.htm )
10.你天天在用的Gemini Flash模型居然是意外本集深度简介 这期Lewis和Will从内部视角拆Google大模型这几年的产品与工程博弈。开篇直击Flash 3.5这次三倍涨价:Flash当年根本不在产品线规划里,是Pro升级速度掉到两三倍、time to first token撑不住聊天机器人客户三秒drop 30%用户的硬指标,才在一个月内紧急训练出来的"意外惊喜"。 * 慢一点换更高智能是不是好trade off? * Google为什么先发Flash,而不是Pro? 我们聊到token定价的玄学:成本算得清,但定价全靠先到市场的定价权,Google和Anthropic早期只能跟着 OpenAI;以及从去年12月Opus拿到编程这个break out use case后,整个行业从打价格战转向每次发布都涨价的拐点。 后半段我们聊到Gemini在ChatGPT上线前两个月、从七人小组到百人团队,为什么DocAI数据如何反哺Gemini的文档理解能力,还有PM与工程师在Flash-lite免费策略上的真实对抗。 时间线索引 00:00 开场 + 听众参与的新尝试 00:45 Flash三倍涨价 04:29 产品思维vs工程师思维 14:54 token定价玄学 21:44 谷歌为什么迭代慢 26:16 下一个跃进 32:02 Gemini诞生史 40:40 上周趣闻 我们聊到的话题 * Meta发布250亿美元企业债券全(https://www.reuters.com/technology/meta-weighs-big-equity-raising-finance-ai-infrastructure-ft-reports-2026-06-05/) * Gemini Diffusion (https://deepmind.google/models/gemini-diffusion/) * OpenRouter的模型排行(https://openrouter.ai/rankings)
9.没有模型,没有渠道,Genspark在赌什么本集深度简介 这一期我们拆Genspark.ai,这家由前百度小度核心高管2023年在硅谷创立、靠20人团队做出爆炸式营收和成长的公司。从对标Perplexity起步,agent来了之后果断放弃旧use case,靠生成PPT和"Call for me"打电话功能在日本意外出圈。我们和Manus做对比:同样的中国团队、同样的领域、接近的估值,但Manus收购被叫停,Genspark还在自己往前跑。 硬核的讨论集中在它到底有没有护城河。Genspark号称背后接了70个模型,做了大量harness和plumbing的脏活累活,按场景在速度、成本、智能三者间做编排。但Lewis的判断是这种差异化正在快速收窄。它没自己的模型,go-to-market不如微软、谷歌、所谓数据飞轮也比有直接入口的大厂差两三个数量级。 我们也戳穿了估值游戏:200万月活、ARR这些数字里的灰色地带怎么算、为什么早期融资只需要说服一个投资者、为什么这阶段该死磕增长而不是留存。延伸聊到大厂高管创业的反直觉优势(人脉、招人、决策力)与"眼高手低"的陷阱。最后一个真问题:没有模型、没有数据中心,Genspark为什么要融4亿多美金,是走企业路线?还是砸钱做市场营销?还是要去做自己的模型? 时间线索引 00:00 拆Genspark 02:42 把agent缝进Workspace 04:26 70个模型的harness编排 09:01 Office与workspace的护城河 12:15 Distribution is king 16:06 200万月活与ARR的水分 20:43 增长还是留存 27:50 高管创业的陷阱 40:26 上周趣闻Opus 4.8和workflow 我们聊到的话题 * Claude 4.8发布: https://www.anthropic.com/news/claude-opus-4-8 * Claude code workflow: https://code.claude.com/docs/en/workflows * Manus出圈demo: https://www.youtube.com/watch?v=K27diMbCsuw * Semrush关于Genspark的流量数据:https://www.semrush.com/website/genspark.ai/overview/ * Decagon (AI电话客服): https://decagon.ai/ * Gamma (AI Slide的竞品): https://gamma.app/
8.谷歌前员工硬核拆解Google I/O这期播客Lewis和Will两个Google前员工从内部视角复盘I/O 2026。这次Google居然没launch Gemini 3.5 Pro,只先放了Flash。Lewis拆当年做模型的真实困境:Pro和Flash差距拉不开,4倍价差定不出来,所以只能Flash先行,这条线索一直贯穿到现在。 Will从Agent经济学算账:token cost指数级失控已经压不住了,何凯明的paper直接质疑per-token定价模式,Google押注cost+speed+live mode的300ms TTFT,未来一年可能才是真正的position优势。 我们也毫不客气吐槽Antigravity 2.0:IDE概念升级后直接消失、紧急公关加回button、还和Gemini CLI重复造轮子——典型的大厂病。还聊了Gemini Spark的命名内幕、Omni到底是真unify还是换壳、World Model有没有research支撑。迭代意料之中,Distribution is the King才是Google真正的护城河。 时间线索引 00:00 Gemini 3.5 Flash登场:为什么agent时代"便宜又快"比变强更打动人 02:46 Flash好迭代、Pro难拉开差距:前Gemini员工讲发布顺序与定价内幕 11:00 Omni多模态:是真突破,还是旧模型套新壳、靠post training防regression 16:17 Antigravity 2.0:抄Cursor抄Claude Code、IDE消失的乌龙与大厂形象工程 22:24 Gemini Spark:为何要做成独立产品,入口之争与Spark命名往事 26:54 I/O整体复盘:Distribution护城河,solid但缺新意 31:11 拓展新闻:大模型攻克80年数学难题与面向agent记忆的StateBench 我们聊到的话题 OpenAI解决80年的数学问题(https://openai.com/index/model-disproves-discrete-geometry-conjecture/) STATE-Bench (https://opensource.microsoft.com/blog/2026/05/19/introducing-state-bench-a-benchmark-for-ai-agent-memory/ )
7.7人干翻Notion? Obsidian反硅谷的成功7个人、0融资、$25M ARR。Obsidian把VC那套增长叙事撕得稀碎。这期拆这家"反硅谷三件套"的笔记公司:当Mem烧掉OpenAI Startup Fund $25M Reflect/Tana/Heptabase全军覆没时,它靠不做AI、不上云、不tracking用户活下来了,反过来成了Claude最好的context层。 第一,所有人都把Obsidian的护城河归因于local文件,错了。真正的壁垒是用户full control激发的创新意愿,你在vault里投入几百小时搭的知识图谱,那个能力是你自己的,但你迁不走。这和Databricks、AWS账单复杂到看不懂是同一套设计哲学:complexity by design,把摩擦本身做成粘性。 第二,Obsidian连自己有多少DAU都不知道,by default不tracking。这种反产品经理姿态意外变成了preserve privacy的卖点,但同时也是它走不了VC路线的根本卡点。 第三,过去几年Mem烧光OpenAI Startup Fund的23M、Reflect、Tana、Heptabase这批AI first note taking集体扑街,反AI的Obsidian反而被Claude反向成就。Markdown格式让Claude Code能直接读你的vault。Note Taking可能已经走到头,Note Seeing才是下一站,Note for Agent才是新的契合点。 我们也辩论了拿不拿VC的浪漫主义vs幸存者偏差、早期投资投人还是投增长、以及Notion和Obsidian长期谁能赢这场battle。 我们在这期聊到的一些公司和话题: * Obsidian (https://obsidian.md/) * Obsidian-Claude (https://github.com/AgriciDaniel/claude-obsidian ) * Knowledge graph conference 2026 (https://www.knowledgegraph.tech/) * BitNet b1.58 2B4T Technical Report (https://arxiv.org/pdf/2504.12285) 时间线索引 00:00 Obsidian的反硅谷三件套 - 7人/0融资/25M ARR 02:49 不做AI却被AI需要: 反增长叙事下的护城河悖论 05:47 local-first真正的护城河不是数据归属,是full control带来的创新粘性 08:51 Complexity by Design: 从Obsidian门槛到Databricks账单的同一套留人逻辑 12:43 反AI的注脚: 手动knowledge engineering vs AI主动capture的矛盾 15:12 浪漫主义创业vs把VC当validation筛子: 拿不拿钱的底层判断 22:31 Obsidian不做用户tracking:反产品经理是principle还是历史包袱 26:14 估值只能go up: seed轮拿多少钱的双刃剑 29:31 Note Taking正在消亡: Notion和Obsidian谁能跑赢note seeing时代 33:50 Collaboration绕不开上云: Note for Agent才是真正的破圈口
6.拆公司! Unstructured.io 600万下载背后的0.02%转化率这一期《硅谷温差》,我们把手术刀对准了RAG时代的明星初创公司Unstructured.io。当所有AI Lab都在追求模型层面时,Unstructured.io却在ChatGPT发布的三个月前就瞄准了那些被大厂工程师“不屑一顾”的脏活: 文档预处理 。 在RAG爆火的这两年,Unstructured.io凭借对65种复杂文件格式的暴力拆解赢得了开发者口碑和近600万开源的下载量。但作为资深建设者,我们必须直面那个温差: * 在工程实现上,帮你搞定 PDF 里的表格确实很爽,但这足以支撑一家初创的估值吗? * 在Vibe Coding盛行、大模型厂商开始下沉并原生支持数据的今天,单纯的Plumbing还能维持多久的技术红利? 本期节目,Lewis和Will深度拆解了这家由前CIA分析师创立的明星项目。讨论了它如何利用ChatGPT发布前的空窗期,通过的深度绑定和开源快速占领开发者心智。面对Vibe Coding带来的开发门槛下降,以及OpenAI、Google等巨头直接在接口端集成文件处理能力,第三方工具的结构性摩擦正在显现。 针对Unstructured.io面临的0.02%极低付费转化率及云服务商的围剿,我们结合各自在微软和Google的实战经验,为企业级数据创业指出了三条路:垂直化深耕、深度整合平台生态、以及从简单的RAG转向更硬核的Context Graph建设 。这是一场关于“护城河”消失与重构的深度复盘。 我们在这期聊到的一些公司和话题: * Unstructured.io (https://unstructured.io/) * OpenAI据传开始研发自己的手机 (https://www.theverge.com/ai-artificial-intelligence/924063/openai-phone-rumors-2027-ming-chi-kuo) * Vertex AI重新命名Agent platform (https://cloud.google.com/blog/products/ai-machine-learning/the-new-gemini-enterprise-one-platform-for-agent-development) * Lovelace.ai (https://lovelace.ai/) 时间线索引 00:00 新系列开场:拆解早期初创的商业模式与技术护城河 。 00:45 Unstructured.io 的野路子:CIA背景的创始人和文档脏活”。 02:57 从智能到管道:为什么Plumbing在RAG时代更具穿透力 。 08:14 开源与PLG陷阱:600 万次下载背后,为何换不来高效的企业级转化 。 11:18 大模型原生下沉与Agentic Search对传统管道的降维打击 。 24:24 CEO视角的破局方案:垂直化深耕、Context Graph建设与寻找Founder-Product Fit 。
5.AI创业的生存法则: 垂直AI + 小而美在 AI Lab巨头不断迭代的背景下,初创公司的边界在哪里?本期节目中,Lewis 和 Will 结合自身在硅谷的观察与实战经验,深度拆解了垂直领域AI (Vertical AI) 的创业机会。我们聊到了为什么VC正在从看好平台型公司转向量化垂直领域的深度,以及如何利用领域知识 (Domain Know-how)和私有数据在法律、农业、医疗等传统行业构建核心壁垒。 * VC为何警惕模型层创业,以及初创公司如何通过深挖垂直业务场景来避免被大模型一波带走。 * 为什么“技术大牛 + 行业老炮”是 AI 时代最完美的创业拍档? * 我们深挖了几个行业案例 * Harvey AI: 法律初创公司如何通过ChatGPT切入,并迅速拿下普华永道等大单。 * EvenUp: 如何利用法律文书等 LLM 无法爬取的“私有数据”构建护城河。 * Blue River Technology: 斯坦福博士如何通过给杂草喷农药这个极其细分的场景,被John Deere以3.05亿美元收购。 * AI时代的“个人 SaaS”: 讨论了随着AI提效,未来的软件行业是否会像自媒体一样,进入万众SaaS的繁荣时代。 本期我们聊到的话题: * Harvard Business Review - Heavy Machinery Meets AI * Uber CTO说4个月用完了全年的Claude budget * John Ternus接管Apple掌门人 时间线索引 00:00 播客开篇:为什么在AI创业中选择“小而美”的垂直赛道 01:59 避开LLM wrapper陷阱:投资人眼中的硬核技术与垂直壁垒 05:32 完美的创业组合:当Domain knowledge撞上工程实现 09:00 Harvey vs EvenUp:深度垂直与私有数据带来的非线性优势 13:32 工程思维 vs 业务思维:从处理dirty work到构建知识图谱 15:42 寻找生态位:服务AI labs的plumbing work与模拟环境构建 17:13 定制化粘性:复刻Palantir模式,提高客户的迁移成本 24:52 案例复盘:Blue River如何靠解决一颗“杂草”实现数亿美金退出 30:56 个人SaaS时代的到来:大厂裁员背景下的long tail机会 36:03 终极思考:当AI接管了专业技能,人类的价值锚点在哪里
4.SaaS已死? UI已亡? 当软件不再需要学习,护城河在哪里每个人都讨厌繁琐的报销程序,在AI Agent的时代,这种被软件奴役的日子可能到头了。在本期《硅谷温差》中,Lewis和Will将深入拆解在硅谷被热议的话题:SaaS真的死了吗? 如果软件不再需要图形界面,如果学习成本归零,那些估值百亿的SaaS巨头还能靠什么活下去? * UI的终结: 为什么自然语言才是最终的终端?当Agent接管了所有的脏活累活,复杂的菜单和按钮将彻底消失。 * 护城河的转移: 代码不再值钱,逻辑可以被AI抄袭。在Agent时代,企业的真正壁垒是那些藏在员工脑子里的Tribal Knowledge和不可复制的核心数据。 * 商业模式的革命: 订阅制已老,基于结果的定价到底有没有出路。 * 商业新物种: 为什么未来会出现2人组成的10亿美金公司? 无论你是SaaS行业的创业者、开发者,还是每天在各种软件系统里挣扎的打工人,这一期都会让你重新思考:在AI时代,我们到底需要什么样的工具。 本期我们聊到的话题: * Menlo Ventures: Software Finally Gets to Work: The Opportunity in * Claude最新发布的Managed Agent * Claude的Memory API 时间线索引 00:00 UI之死:为什么Agent时代手动填表是效率自杀 01:59 交互重构:自然语言如何让专业软件的学习成本归零 04:16 Intent驱动:从完成任务到记住意图的边际收益转换 06:29 SaaSforAgent:当MCP协议与Skill成为软件的新形态 07:46 护城河迷思:为什么BusinessLogic在Token面前不再保值 11:42 Tribal Knowledge:散落在文档之外的非数字化数据才是真堡垒 16:28 算力套利:小模型(SLM)与开源模型在成本战中的战略地位 19:05 定价博弈:Outcome-basedpricing如何重塑SaaS毛利结构 24:00 组织变革:5个人能撑起10亿营收吗?劳动力与算力的对调 34:01 Vertical SaaS:垂直领域如何靠业务深度对抗通用智能的蚕食
3.AI 焦虑: 当写代码不再是门槛,科技职场的下半场在哪欢迎收听《硅谷温差》第三期!最近的 AI 圈简直像是按下了快进键,Lewis 和 Will 从 Andrej Karpathy 的一条推特聊起,面对一个月上千篇的论文和层出不穷的新工具,身处硅谷风暴中心的我们也真真切切地感受到了前所未有的“AI 焦虑”。 当Linked Memory这样的想法在 48 小时内就能被社区代码化,当一个月像过去的一年一样漫长,身处旋涡中心的我们该如何自处? 本期节目,我们不仅聊焦虑,更在聊边界的消失与新秩序的建立: * 协作关系的瓦解与重组: 为什么曾经 1 个产品经理、1 个设计师配 10 个工程师的“黄金比例”正在消失? 为什么现在的设计师已经开始写 API Spec? * 核心竞争力的回归: 如果 LeetCode 的算法题已经失去了筛选意义,未来的面试会不会变成长达 6 小时的 Agent 协同实战? 为什么说深厚的计算机科学底层功底,反而在 AI 时代成了更大的“杠杆”? * “一人公司”的兴起: 两人创业就能撬动 18 亿美金年营收? 我们聊了聊 Base44的案例,探讨如何利用 AI Agent 构建属于自己的数字孪生团队。 * 信息过载的自救: 面对每天如洪水般的技术推文和论文,我们分享了各自的信息脱水秘籍——从 AI 自动过滤到“让信息飞行一个月”的沉淀法则。 节目中我们聊到的话题: * Pessimists Archive * Crunchbase: Q1 2026 Shatters Venture Funding Records As AI Boom Pushes Startup Investment To $300B * Latency Space * Gary Marcus * 纽约时报: A.I. Could Change the World. But First It Is Changing Silicon Valley 时间线索引 00:00 信息过载下的防波堤 04:15 VibeCoding与手写代码的黄昏 07:24 黄金比例的坍缩 11:59 单兵能力的指数级放大 14:45 工程师的医生化转型 18:56 一个人的独角兽。 24:39 警惕VibeCoding陷阱 33:16 大厂招聘的底层博弈 36:41 产品经理的硬核壁垒 38:34 专家过滤机制
2.Agent记忆系统 = AGI ?本期《硅谷温差》,Lewis 和 Will 深度拆解了 Agent 架构中最令开发者头疼的模块——记忆系统。大家普遍认为加上记忆,Agent 就能通往 AGI ,但实战中,开发者往往被 Vector DB 的“时序缺失”和“数字不敏感”搞得焦头烂额 。 我们不仅讨论了 memory 如何让 Agent 更像真人 ,更直击了当前 RAG 系统的核心痛点:冗余信息导致的“去魅”现象和模型逻辑崩溃 。Will 详细对比了从 Manus 简单的 Context Window 方案 到 Claude Code 基于 Markdown 文件系统的动态检索策略 ,揭示了为什么“反向操作”——把 raw data 扔进文件系统让 Agent 自己去 grep,反而更具灵活性 。 本集的“硬核”亮点在于对 “Dreaming(梦境)”机制的探讨 * 记忆不应只是存储,更应该是像人脑一样在非活跃时间进行 consolidation(整合) * 我们提出了一个极具争议的观点:Agent 必须学会“遗忘” * 为了维持逻辑自洽和决策效率,主动丢弃旧的、冲突的细节比全量保存更重要 。 最后,我们探讨了 toB 落地中的结构性误区:很多企业分不清什么是“工具调用”,什么是“记忆储备” 。 时间线索引 00:00 记忆系统与AGI的入场券:从Manus到人脑模拟的路径思考 02:50 向量数据库的硬伤:为什么Vector DB处理不了数字与时序逻辑 05:01 记忆后端演进:文件系统、知识图谱与Agentic Memory的实战选型 15:38 主动遗忘的必要性:解决Agent自相矛盾与决策困境的“剪枝”策略 22:38 商业落地瓶颈:toB场景下记忆、工具与技能的边界模糊及其ROI考量 25:13 行业终局探讨:记忆层应当是OS级的基建,还是大模型厂商的口中食
1.OpenClaw到底是生产力神器,还是高级玩具?本期节目《OpenClaw到底是生产力神器,还是高级玩具?》,我们将聚焦最近最火的自主 Agent 框架 OpenClaw,深入分享我们的实战心得。 大多数 AI 的突破,都发生在高深技术与日常应用的交汇点。在本期节目中,Lewis 和 Will 将带你深入探讨现实中的如何将底层的 AI 模型转化为高效的生产力引擎。无论你是开发者、产品经理,或是对 AI 未来充满好奇的观察者,你都将看到像 Openclaw 这样尖端的智能体(Agents)如何超越消费级的“热度”,重新定义自动化与效率。 Will和Lewis分享了他们从资深用户进阶为创新者的心路历程,揭秘AI如何深度嵌入生活的方方面面:从利用 cron job 管理个人财务,到AI驱动的迭代实验设计日式庭院。与此同时,拆解了部署系统时的实战挑战,从本地机器的开发环境搭建,到生产环境中的风险控制与安全管理。 播客里提到的内容 * Kimi杨植麟GTC2026演讲 * Alpha Evolve 内容时间轴 00:00 生产力神器还是高级玩具:Openclaw 在复杂项目中的多任务上下文瓶颈。 02:32 架构深度对比:为什么 Discord 频道的 Channel 逻辑比 Claude Code 更适合处理 AI Strategy。 07:55 算力与隔离的结构性矛盾:128G 内存本地运行 vs. GCP 云端隔离的权衡与 Connector 补丁。 12:30 递归式进化:用 Openclaw 改写自己的内存层(Memory System)及故障自恢复的小技巧。 19:28 价值度量重构:从代码行数到 Impact per Token,如何定义 Agent 时代的开发者绩效。 27:13 Agent 的终极形态:从手机媒介的局限性到“24/7 全知助理”的硬件想象空间。