硅谷温差 | 小宇宙 - 听播客，上小宇宙

74已订阅

硅谷温差

LewisLiu2026、WillLu-svg

单集更新

节目详情

11.美国断供最强人工智能Fable
本集深度简介 Anthropic万众瞩目的Fable 5模型上线72小时就被政府强制下架,这场drama从Mythos的公关造势一路演到全球禁令。我们从亲手实测说起:max计划跑refactor的task,跑到一半token耗尽,等下一个session接着跑——结论是没找到任何一个非它不可的场景。真正的暗坑在于"降智"被写进了说明书:Anthropic fable 5加了router,把它判定为有风险的task偷偷降到Opus跑,却照样按最贵的价格收费。从产品角度这就是欺诈。用一个好模型当funnel,把便宜模型高价卖出去,消费者完全失去control,最初连什么时候降了智都不知道。Lewis用Gemini时期的经验拆解了这套逻辑:质量与价格的tradeoff该不该扔给用户决定,以及"不记录用户数据"这条信任红线一旦迈出去就再也收不回来。更深一层是访问平权问题:谁有资格用最强的智能?标榜"让所有人用上AI"的公司,真正部署时却按护照、企业和个人来分发？这就是AI霸权。再叠加企业数据从零留存被强改成30天留存、微软直接停用,所有CEO都被迫意识到：核心业务不能rent在别人的AI上,开源模型成了唯一的解。两人也顺势聊到中国开源模型靠数据优势长期可能反超,以及黑市上一条用户trace只卖10美元的灰色产业链。时间线索引 00:00 实测跑到一半没token 03:04 降智被写进说明书 06:38 用户数据是信任红线 08:47 谁有资格访问最强智能 11:10 政府禁令的真实动机 15:05 30天数据留存 31:51 开源模型的数据优势 37:15 上周趣闻我们聊到的话题 * Anthropic道歉降智 (https://x.com/ClaudeDevs ) * OpenAI推迟2027上市 (https://www.reuters.com/business/openai-expects-go-public-within-next-year-information-reports-2026-06-10/ ) * SpaceX上市招股书 (https://www.sec.gov/Archives/edgar/data/1181412/000162828026036936/spaceexplorationtechnologi.htm )
40分钟 · 3天前
37
0
10.你天天在用的Gemini Flash模型居然是意外
本集深度简介这期Lewis和Will从内部视角拆Google大模型这几年的产品与工程博弈。开篇直击Flash 3.5这次三倍涨价：Flash当年根本不在产品线规划里，是Pro升级速度掉到两三倍、time to first token撑不住聊天机器人客户三秒drop 30%用户的硬指标，才在一个月内紧急训练出来的"意外惊喜"。 * 慢一点换更高智能是不是好trade off？ * Google为什么先发Flash，而不是Pro？我们聊到token定价的玄学：成本算得清，但定价全靠先到市场的定价权，Google和Anthropic早期只能跟着 OpenAI；以及从去年12月Opus拿到编程这个break out use case后，整个行业从打价格战转向每次发布都涨价的拐点。后半段我们聊到Gemini在ChatGPT上线前两个月、从七人小组到百人团队，为什么DocAI数据如何反哺Gemini的文档理解能力，还有PM与工程师在Flash-lite免费策略上的真实对抗。时间线索引 00:00 开场 + 听众参与的新尝试 00:45 Flash三倍涨价 04:29 产品思维vs工程师思维 14:54 token定价玄学 21:44 谷歌为什么迭代慢 26:16 下一个跃进 32:02 Gemini诞生史 40:40 上周趣闻我们聊到的话题 * Meta发布250亿美元企业债券全(https://www.reuters.com/technology/meta-weighs-big-equity-raising-finance-ai-infrastructure-ft-reports-2026-06-05/) * Gemini Diffusion (https://deepmind.google/models/gemini-diffusion/) * OpenRouter的模型排行(https://openrouter.ai/rankings)
44分钟 · 8天前
14
0
9.没有模型，没有渠道，Genspark在赌什么
本集深度简介这一期我们拆Genspark.ai，这家由前百度小度核心高管2023年在硅谷创立、靠20人团队做出爆炸式营收和成长的公司。从对标Perplexity起步，agent来了之后果断放弃旧use case，靠生成PPT和"Call for me"打电话功能在日本意外出圈。我们和Manus做对比：同样的中国团队、同样的领域、接近的估值，但Manus收购被叫停，Genspark还在自己往前跑。硬核的讨论集中在它到底有没有护城河。Genspark号称背后接了70个模型，做了大量harness和plumbing的脏活累活，按场景在速度、成本、智能三者间做编排。但Lewis的判断是这种差异化正在快速收窄。它没自己的模型，go-to-market不如微软、谷歌、所谓数据飞轮也比有直接入口的大厂差两三个数量级。我们也戳穿了估值游戏：200万月活、ARR这些数字里的灰色地带怎么算、为什么早期融资只需要说服一个投资者、为什么这阶段该死磕增长而不是留存。延伸聊到大厂高管创业的反直觉优势(人脉、招人、决策力)与"眼高手低"的陷阱。最后一个真问题:没有模型、没有数据中心,Genspark为什么要融4亿多美金，是走企业路线？还是砸钱做市场营销？还是要去做自己的模型? 时间线索引 00:00 拆Genspark 02:42 把agent缝进Workspace 04:26 70个模型的harness编排 09:01 Office与workspace的护城河 12:15 Distribution is king 16:06 200万月活与ARR的水分 20:43 增长还是留存 27:50 高管创业的陷阱 40:26 上周趣闻Opus 4.8和workflow 我们聊到的话题 * Claude 4.8发布: https://www.anthropic.com/news/claude-opus-4-8 * Claude code workflow: https://code.claude.com/docs/en/workflows * Manus出圈demo: https://www.youtube.com/watch?v=K27diMbCsuw * Semrush关于Genspark的流量数据：https://www.semrush.com/website/genspark.ai/overview/ * Decagon (AI电话客服): https://decagon.ai/ * Gamma (AI Slide的竞品): https://gamma.app/
43分钟 · 16天前
29
2
8.谷歌前员工硬核拆解Google I/O
这期播客Lewis和Will两个Google前员工从内部视角复盘I/O 2026。这次Google居然没launch Gemini 3.5 Pro，只先放了Flash。Lewis拆当年做模型的真实困境：Pro和Flash差距拉不开，4倍价差定不出来，所以只能Flash先行，这条线索一直贯穿到现在。 Will从Agent经济学算账：token cost指数级失控已经压不住了，何凯明的paper直接质疑per-token定价模式，Google押注cost+speed+live mode的300ms TTFT，未来一年可能才是真正的position优势。我们也毫不客气吐槽Antigravity 2.0：IDE概念升级后直接消失、紧急公关加回button、还和Gemini CLI重复造轮子——典型的大厂病。还聊了Gemini Spark的命名内幕、Omni到底是真unify还是换壳、World Model有没有research支撑。迭代意料之中，Distribution is the King才是Google真正的护城河。时间线索引 00:00 Gemini 3.5 Flash登场：为什么agent时代"便宜又快"比变强更打动人 02:46 Flash好迭代、Pro难拉开差距：前Gemini员工讲发布顺序与定价内幕 11:00 Omni多模态：是真突破，还是旧模型套新壳、靠post training防regression 16:17 Antigravity 2.0：抄Cursor抄Claude Code、IDE消失的乌龙与大厂形象工程 22:24 Gemini Spark：为何要做成独立产品，入口之争与Spark命名往事 26:54 I/O整体复盘：Distribution护城河，solid但缺新意 31:11 拓展新闻：大模型攻克80年数学难题与面向agent记忆的StateBench 我们聊到的话题 OpenAI解决80年的数学问题(https://openai.com/index/model-disproves-discrete-geometry-conjecture/) STATE-Bench (https://opensource.microsoft.com/blog/2026/05/19/introducing-state-bench-a-benchmark-for-ai-agent-memory/ )
34分钟 · 21天前
22
0
7.7人干翻Notion? Obsidian反硅谷的成功
7个人、0融资、$25M ARR。Obsidian把VC那套增长叙事撕得稀碎。这期拆这家"反硅谷三件套"的笔记公司：当Mem烧掉OpenAI Startup Fund $25M Reflect/Tana/Heptabase全军覆没时，它靠不做AI、不上云、不tracking用户活下来了，反过来成了Claude最好的context层。第一，所有人都把Obsidian的护城河归因于local文件，错了。真正的壁垒是用户full control激发的创新意愿，你在vault里投入几百小时搭的知识图谱，那个能力是你自己的，但你迁不走。这和Databricks、AWS账单复杂到看不懂是同一套设计哲学：complexity by design，把摩擦本身做成粘性。第二，Obsidian连自己有多少DAU都不知道，by default不tracking。这种反产品经理姿态意外变成了preserve privacy的卖点，但同时也是它走不了VC路线的根本卡点。第三，过去几年Mem烧光OpenAI Startup Fund的23M、Reflect、Tana、Heptabase这批AI first note taking集体扑街，反AI的Obsidian反而被Claude反向成就。Markdown格式让Claude Code能直接读你的vault。Note Taking可能已经走到头，Note Seeing才是下一站，Note for Agent才是新的契合点。我们也辩论了拿不拿VC的浪漫主义vs幸存者偏差、早期投资投人还是投增长、以及Notion和Obsidian长期谁能赢这场battle。我们在这期聊到的一些公司和话题： * Obsidian (https://obsidian.md/) * Obsidian-Claude (https://github.com/AgriciDaniel/claude-obsidian ) * Knowledge graph conference 2026 (https://www.knowledgegraph.tech/) * BitNet b1.58 2B4T Technical Report (https://arxiv.org/pdf/2504.12285) 时间线索引 00:00 Obsidian的反硅谷三件套 - 7人/0融资/25M ARR 02:49 不做AI却被AI需要: 反增长叙事下的护城河悖论 05:47 local-first真正的护城河不是数据归属，是full control带来的创新粘性 08:51 Complexity by Design: 从Obsidian门槛到Databricks账单的同一套留人逻辑 12:43 反AI的注脚: 手动knowledge engineering vs AI主动capture的矛盾 15:12 浪漫主义创业vs把VC当validation筛子: 拿不拿钱的底层判断 22:31 Obsidian不做用户tracking：反产品经理是principle还是历史包袱 26:14 估值只能go up: seed轮拿多少钱的双刃剑 29:31 Note Taking正在消亡: Notion和Obsidian谁能跑赢note seeing时代 33:50 Collaboration绕不开上云: Note for Agent才是真正的破圈口
40分钟 · 1 个月前
20
3
6.拆公司! Unstructured.io 600万下载背后的0.02%转化率
这一期《硅谷温差》，我们把手术刀对准了RAG时代的明星初创公司Unstructured.io。当所有AI Lab都在追求模型层面时，Unstructured.io却在ChatGPT发布的三个月前就瞄准了那些被大厂工程师“不屑一顾”的脏活: 文档预处理。在RAG爆火的这两年，Unstructured.io凭借对65种复杂文件格式的暴力拆解赢得了开发者口碑和近600万开源的下载量。但作为资深建设者，我们必须直面那个温差： * 在工程实现上，帮你搞定 PDF 里的表格确实很爽，但这足以支撑一家初创的估值吗？ * 在Vibe Coding盛行、大模型厂商开始下沉并原生支持数据的今天，单纯的Plumbing还能维持多久的技术红利？本期节目，Lewis和Will深度拆解了这家由前CIA分析师创立的明星项目。讨论了它如何利用ChatGPT发布前的空窗期，通过的深度绑定和开源快速占领开发者心智。面对Vibe Coding带来的开发门槛下降，以及OpenAI、Google等巨头直接在接口端集成文件处理能力，第三方工具的结构性摩擦正在显现。针对Unstructured.io面临的0.02%极低付费转化率及云服务商的围剿，我们结合各自在微软和Google的实战经验，为企业级数据创业指出了三条路：垂直化深耕、深度整合平台生态、以及从简单的RAG转向更硬核的Context Graph建设。这是一场关于“护城河”消失与重构的深度复盘。我们在这期聊到的一些公司和话题： * Unstructured.io (https://unstructured.io/) * OpenAI据传开始研发自己的手机 (https://www.theverge.com/ai-artificial-intelligence/924063/openai-phone-rumors-2027-ming-chi-kuo) * Vertex AI重新命名Agent platform (https://cloud.google.com/blog/products/ai-machine-learning/the-new-gemini-enterprise-one-platform-for-agent-development) * Lovelace.ai (https://lovelace.ai/) 时间线索引 00:00 新系列开场：拆解早期初创的商业模式与技术护城河。 00:45 Unstructured.io 的野路子：CIA背景的创始人和文档脏活”。 02:57 从智能到管道：为什么Plumbing在RAG时代更具穿透力。 08:14 开源与PLG陷阱：600 万次下载背后，为何换不来高效的企业级转化。 11:18 大模型原生下沉与Agentic Search对传统管道的降维打击。 24:24 CEO视角的破局方案：垂直化深耕、Context Graph建设与寻找Founder-Product Fit 。
41分钟 · 1 个月前
17
1
5.AI创业的生存法则: 垂直AI + 小而美
在 AI Lab巨头不断迭代的背景下，初创公司的边界在哪里？本期节目中，Lewis 和 Will 结合自身在硅谷的观察与实战经验，深度拆解了垂直领域AI (Vertical AI) 的创业机会。我们聊到了为什么VC正在从看好平台型公司转向量化垂直领域的深度，以及如何利用领域知识 (Domain Know-how)和私有数据在法律、农业、医疗等传统行业构建核心壁垒。 * VC为何警惕模型层创业，以及初创公司如何通过深挖垂直业务场景来避免被大模型一波带走。 * 为什么“技术大牛 + 行业老炮”是 AI 时代最完美的创业拍档？ * 我们深挖了几个行业案例 * Harvey AI: 法律初创公司如何通过ChatGPT切入，并迅速拿下普华永道等大单。 * EvenUp: 如何利用法律文书等 LLM 无法爬取的“私有数据”构建护城河。 * Blue River Technology: 斯坦福博士如何通过给杂草喷农药这个极其细分的场景，被John Deere以3.05亿美元收购。 * AI时代的“个人 SaaS”: 讨论了随着AI提效，未来的软件行业是否会像自媒体一样，进入万众SaaS的繁荣时代。本期我们聊到的话题： * Harvard Business Review - Heavy Machinery Meets AI * Uber CTO说4个月用完了全年的Claude budget * John Ternus接管Apple掌门人时间线索引 00:00 播客开篇：为什么在AI创业中选择“小而美”的垂直赛道 01:59 避开LLM wrapper陷阱：投资人眼中的硬核技术与垂直壁垒 05:32 完美的创业组合：当Domain knowledge撞上工程实现 09:00 Harvey vs EvenUp：深度垂直与私有数据带来的非线性优势 13:32 工程思维 vs 业务思维：从处理dirty work到构建知识图谱 15:42 寻找生态位：服务AI labs的plumbing work与模拟环境构建 17:13 定制化粘性：复刻Palantir模式，提高客户的迁移成本 24:52 案例复盘：Blue River如何靠解决一颗“杂草”实现数亿美金退出 30:56 个人SaaS时代的到来：大厂裁员背景下的long tail机会 36:03 终极思考：当AI接管了专业技能，人类的价值锚点在哪里
43分钟 · 2个月前
34
1
4.SaaS已死? UI已亡? 当软件不再需要学习，护城河在哪里
每个人都讨厌繁琐的报销程序，在AI Agent的时代，这种被软件奴役的日子可能到头了。在本期《硅谷温差》中，Lewis和Will将深入拆解在硅谷被热议的话题：SaaS真的死了吗？如果软件不再需要图形界面，如果学习成本归零，那些估值百亿的SaaS巨头还能靠什么活下去？ * UI的终结：为什么自然语言才是最终的终端？当Agent接管了所有的脏活累活，复杂的菜单和按钮将彻底消失。 * 护城河的转移：代码不再值钱，逻辑可以被AI抄袭。在Agent时代，企业的真正壁垒是那些藏在员工脑子里的Tribal Knowledge和不可复制的核心数据。 * 商业模式的革命：订阅制已老，基于结果的定价到底有没有出路。 * 商业新物种：为什么未来会出现2人组成的10亿美金公司？无论你是SaaS行业的创业者、开发者，还是每天在各种软件系统里挣扎的打工人，这一期都会让你重新思考：在AI时代，我们到底需要什么样的工具。本期我们聊到的话题： * Menlo Ventures: Software Finally Gets to Work: The Opportunity in * Claude最新发布的Managed Agent * Claude的Memory API 时间线索引 00:00 UI之死：为什么Agent时代手动填表是效率自杀 01:59 交互重构：自然语言如何让专业软件的学习成本归零 04:16 Intent驱动：从完成任务到记住意图的边际收益转换 06:29 SaaSforAgent：当MCP协议与Skill成为软件的新形态 07:46 护城河迷思：为什么BusinessLogic在Token面前不再保值 11:42 Tribal Knowledge：散落在文档之外的非数字化数据才是真堡垒 16:28 算力套利：小模型(SLM)与开源模型在成本战中的战略地位 19:05 定价博弈：Outcome-basedpricing如何重塑SaaS毛利结构 24:00 组织变革：5个人能撑起10亿营收吗？劳动力与算力的对调 34:01 Vertical SaaS：垂直领域如何靠业务深度对抗通用智能的蚕食
41分钟 · 2个月前
16
0
3.AI 焦虑: 当写代码不再是门槛，科技职场的下半场在哪
欢迎收听《硅谷温差》第三期！最近的 AI 圈简直像是按下了快进键，Lewis 和 Will 从 Andrej Karpathy 的一条推特聊起，面对一个月上千篇的论文和层出不穷的新工具，身处硅谷风暴中心的我们也真真切切地感受到了前所未有的“AI 焦虑”。当Linked Memory这样的想法在 48 小时内就能被社区代码化，当一个月像过去的一年一样漫长，身处旋涡中心的我们该如何自处？本期节目，我们不仅聊焦虑，更在聊边界的消失与新秩序的建立： * 协作关系的瓦解与重组：为什么曾经 1 个产品经理、1 个设计师配 10 个工程师的“黄金比例”正在消失？为什么现在的设计师已经开始写 API Spec？ * 核心竞争力的回归：如果 LeetCode 的算法题已经失去了筛选意义，未来的面试会不会变成长达 6 小时的 Agent 协同实战？为什么说深厚的计算机科学底层功底，反而在 AI 时代成了更大的“杠杆”？ * “一人公司”的兴起：两人创业就能撬动 18 亿美金年营收？我们聊了聊 Base44的案例，探讨如何利用 AI Agent 构建属于自己的数字孪生团队。 * 信息过载的自救：面对每天如洪水般的技术推文和论文，我们分享了各自的信息脱水秘籍——从 AI 自动过滤到“让信息飞行一个月”的沉淀法则。节目中我们聊到的话题： * Pessimists Archive * Crunchbase: Q1 2026 Shatters Venture Funding Records As AI Boom Pushes Startup Investment To $300B * Latency Space * Gary Marcus * 纽约时报: A.I. Could Change the World. But First It Is Changing Silicon Valley 时间线索引 00:00 信息过载下的防波堤 04:15 VibeCoding与手写代码的黄昏 07:24 黄金比例的坍缩 11:59 单兵能力的指数级放大 14:45 工程师的医生化转型 18:56 一个人的独角兽。 24:39 警惕VibeCoding陷阱 33:16 大厂招聘的底层博弈 36:41 产品经理的硬核壁垒 38:34 专家过滤机制
43分钟 · 2个月前
31
1
2.Agent记忆系统 = AGI ?
本期《硅谷温差》，Lewis 和 Will 深度拆解了 Agent 架构中最令开发者头疼的模块——记忆系统。大家普遍认为加上记忆，Agent 就能通往 AGI ，但实战中，开发者往往被 Vector DB 的“时序缺失”和“数字不敏感”搞得焦头烂额。我们不仅讨论了 memory 如何让 Agent 更像真人，更直击了当前 RAG 系统的核心痛点：冗余信息导致的“去魅”现象和模型逻辑崩溃。Will 详细对比了从 Manus 简单的 Context Window 方案到 Claude Code 基于 Markdown 文件系统的动态检索策略，揭示了为什么“反向操作”——把 raw data 扔进文件系统让 Agent 自己去 grep，反而更具灵活性。本集的“硬核”亮点在于对 “Dreaming（梦境）”机制的探讨 * 记忆不应只是存储，更应该是像人脑一样在非活跃时间进行 consolidation（整合） * 我们提出了一个极具争议的观点：Agent 必须学会“遗忘” * 为了维持逻辑自洽和决策效率，主动丢弃旧的、冲突的细节比全量保存更重要。最后，我们探讨了 toB 落地中的结构性误区：很多企业分不清什么是“工具调用”，什么是“记忆储备” 。时间线索引 00:00 记忆系统与AGI的入场券：从Manus到人脑模拟的路径思考 02:50 向量数据库的硬伤：为什么Vector DB处理不了数字与时序逻辑 05:01 记忆后端演进：文件系统、知识图谱与Agentic Memory的实战选型 15:38 主动遗忘的必要性：解决Agent自相矛盾与决策困境的“剪枝”策略 22:38 商业落地瓶颈：toB场景下记忆、工具与技能的边界模糊及其ROI考量 25:13 行业终局探讨：记忆层应当是OS级的基建，还是大模型厂商的口中食
35分钟 · 2个月前
30
1
1.OpenClaw到底是生产力神器，还是高级玩具？
本期节目《OpenClaw到底是生产力神器，还是高级玩具？》，我们将聚焦最近最火的自主 Agent 框架 OpenClaw，深入分享我们的实战心得。大多数 AI 的突破，都发生在高深技术与日常应用的交汇点。在本期节目中，Lewis 和 Will 将带你深入探讨现实中的如何将底层的 AI 模型转化为高效的生产力引擎。无论你是开发者、产品经理，或是对 AI 未来充满好奇的观察者，你都将看到像 Openclaw 这样尖端的智能体（Agents）如何超越消费级的“热度”，重新定义自动化与效率。 Will和Lewis分享了他们从资深用户进阶为创新者的心路历程，揭秘AI如何深度嵌入生活的方方面面：从利用 cron job 管理个人财务，到AI驱动的迭代实验设计日式庭院。与此同时，拆解了部署系统时的实战挑战，从本地机器的开发环境搭建，到生产环境中的风险控制与安全管理。播客里提到的内容 * Kimi杨植麟GTC2026演讲 * Alpha Evolve 内容时间轴 00:00 生产力神器还是高级玩具：Openclaw 在复杂项目中的多任务上下文瓶颈。 02:32 架构深度对比：为什么 Discord 频道的 Channel 逻辑比 Claude Code 更适合处理 AI Strategy。 07:55 算力与隔离的结构性矛盾：128G 内存本地运行 vs. GCP 云端隔离的权衡与 Connector 补丁。 12:30 递归式进化：用 Openclaw 改写自己的内存层（Memory System）及故障自恢复的小技巧。 19:28 价值度量重构：从代码行数到 Impact per Token，如何定义 Agent 时代的开发者绩效。 27:13 Agent 的终极形态：从手机媒介的局限性到“24/7 全知助理”的硬件想象空间。
34分钟 · 3个月前
49
2

《硅谷温差》是为中文 AI 圈硬核建设者打造的硅谷前沿实战手册，是 Lewis 愿景派与 Will 实战派最终汇合的地方。我们拒绝泛泛而谈的科普，精准锚定硬核从业者、出海创业者和关注技术深度的投资人。我们希望通过对话可以直击 AI 落地中的结构性摩擦，探讨纸面论文与实际业务代码之间的温差。节目都聚焦于 Agent 搭建、知识图谱、记忆系统等实战瓶颈，大谈踩坑日常，为你拆解在 AI 领域，哪些是好看的 Demo，哪些是真正在业务里跑得通的壁垒。