


胡正明院士投资、原子级半导体创业者谢学军:摩尔定律走到原子尽头之后,他想给人类文明造一艘"备份方舟"🎙️ 硅谷洞察局 EP10 | 胡正明院士投资、原子级半导体创业者谢学军:摩尔定律走到原子尽头之后,他想给人类文明造一艘"备份方舟" 一线洞察,深度思考。硅谷核心科技从业者,带你触摸AI变革深处。 --- 📌 本期看点 当全行业在卷大模型与 Agent 应用的时候,半导体的物理边界正被一群更"硬核"的人重新推开。本期请到 UCSB 半导体博士、连续创业者谢学军——获得胡正明院士(FinFET 发明者、半导体界泰山北斗)的投资(公司网站:phantafield.com)。 他从读 PhD 第一天起就只为创业。论文还没毕业,公司已在 2016 年注册;他赌的是 2D TMD 材料、低温 MOCVD 设备、以及让传统半导体行业做了几十年梦的 monolithic 3D 集成。如今 TSMC、Intel、三星都已公开承认:2D 材料是 1nm 节点之后替代硅的下一代方案。 但这只是他的"白天"。到了"晚上",他在做一件听起来像科幻小说的事——一个叫 The Pantheon(万神殿)的项目:用 wearable + 脑机接口给每个人造一个"数字分身",最终为 10 万人提供无限 Token,作为 AGI 时代的 Human Safeguard。他甚至把这套世界观写成了科幻小说《Pantheon Racing》。 更出人意料的是:这位曾经的纯粹唯物主义者,如今在拜孔子后人中和先生孔众学《大学》《中庸》,认真地用计算机科学的语言重新解释"灵魂是硬件、肉身是 UI"。 从原子级晶体管,到伽马射线激光推进器,再到数字轮回——谢学军在做的事,比大多数人敢想的都更远。 --- 💬 本期金句 "我读博士的动机就是为了创业。" —— 00:03:22 "用原子级的技术推动人类社会进步。" —— 00:05:30 "拿着锤子找钉子才是这个世界创新的真相——大部分人看到的成功故事,都是已经有需求的故事。" —— 00:20:55 "原来只有 100 万人会写代码,现在是 10 亿——这个锤子会砸出更多花样的钉子来。" —— 00:23:09 "AGI 时代,人类要真的想在机器面前活下来,一定要有自己的数字分身。" —— 00:29:15 "灵魂是硬件,我们这具肉身只是一个 user interface。" —— 00:40:38 "AI 是我们对未知世界的一种礼盒——是子集,是模仿,没法触达量子层面背后的东西。" —— 00:51:00 "我比他们更笨,所以我敢想能力以外的事——这反而把我拔高了。" —— 00:59:27 "物理能实现的东西,都不是魔法。" —— 01:07:16 --- 📖 本期术语速查(听到不熟悉的词?翻这里) 2D TMD 材料(二维过渡金属硫化物) 天然只有三个原子厚的半导体材料,代表是 MoS₂(二硫化钼)。像洋葱皮一样可以一层层撕开,表面原子级光滑。被产业公认为 1nm 节点替代硅的下一代方案。 Monolithic 3D Integration(单片三维集成) 把晶体管和互连层一层叠一层做出来,而不是像 HBM 那样在封装级堆叠。传统硅工艺因为高温会破坏下层做不到,2D + 低温 MOCVD 让这个梦想成为可能。 MOCVD(金属有机化学气相沉积) 一种半导体材料生长设备。谢学军公司的核心技术是把它做到能低温、高效、低缺陷地生长 2D TMD。 Thermal Budget(热预算) 芯片制造中各工艺步骤的累计热量上限——一旦超过,前面已做好的晶体管就被破坏。Monolithic 3D 必须低温,这是入场券。 FinFET / GAA(鳍式 / 环绕栅极晶体管) 胡正明院士发明的现代晶体管结构。其本质就是"把沟道做薄"。再往下走的极致,就是用 2D 材料。 PDK(Process Design Kit) 晶圆厂给芯片设计公司的工艺设计套件。谢学军把设备对标 TSMC,用同样的 PDK 设计新材料芯片——是它被产业链快速接纳的关键。 HBM(High Bandwidth Memory) GPU 用的高带宽堆叠存储。谢学军的方向是用 2D 材料做 monolithic 3D 缓存,绕过 HBM 物理堆叠的上限。 The Pantheon 谢学军的数字永生项目。用 wearable + 脑机接口收集个人数据,构建数字分身,以无限 Token 让它"活"下去。最终愿景:10 万人组成的 Human Safeguard,在 AGI 时代为人类文明做备份。 Personal Benchmark(个人基准) 不同于 public benchmark,The Pantheon 给每个用户构建专属基准——只有你最知道镜子里那个 agent 是不是你。 Project-Based Learning(项目驱动式学习) Elon Musk 也在推的学习方式:选定一个方向,在做产品的过程中堆知识。 --- 🗂️ 内容大纲 一、为创业而读博:一条非典型的硅谷路径 读 PhD 第一天就为创业;公司 2016 年注册,论文还没毕业 进入二维材料这个"无人区"——彼时石墨烯、MoS₂ 刚被发现 PhD 导师 Costa Bennett 是胡正明的学生——一脉相承的技术血统 二、说服胡正明院士做投资:一封 cold email 的故事 胡正明读过他第一篇博士论文(2D 材料中的低频噪音),印象很深 技术方向正好是胡正明本人的人生使命——推动摩尔定律继续往前 2019 年第一代低温生长设备做出,2023 年 TSMC/Intel/三星集体跟进 三、2D 材料:把硅切薄会碎,但 TMD 天生就这么薄 为什么 2D 是 1nm 节点之后的必然选择? 亚纳米级量子点阵列:用电子束在 2D 材料上"写"出固态量子点 为下一代 GPU 做 3D 堆叠缓存、航天级抗辐射芯片、XR 透明显示驱动…… 四、Product Market Fit:拿着锤子找钉子,才是创新的真相 低成本 prototype 哲学:display、neuromorphic、quantum、logic 都试一遍 每一代硬盘的故事:是技术先有,需求后到——不是反过来 最重要的创新往往投入很小(参考石墨烯的胶带) 五、AI 时代的"用户即 agent":不是把产品变成 agent,是给每个人一个分身 大多数公司把 agent 当工具/秘书;The Pantheon 把它当你的"复制" 数字永生 → 跨星际人类文明备份 → AGI 时代的 Human Safeguard 为什么是 10 万人?因为单一 AGI 太危险,集体智能才是 safeguard 的统计意义 六、灵魂是硬件、肉身是 UI:当哲学撞上计算机科学 从纯粹唯物主义者,到跟随中和先生彭仲学《大学》《中庸》 轮回 ≈ 大模型训练;游戏角色复制 ≈ 转世;Roger Penrose 的量子大脑 拉马努金的无限公式:AI 永远算不出来——它是被"下载"的 七、给研究者与年轻创业者的建议 知人者智,自知者明——find yourself 是无穷动力之源 读文献之上保留想象力——不要把自己困在"engineering" 不要给自己设限:敢想能力以外的事,本身就是一种拔高 八、五年后再听:还会做同样的决定 挫折就是修行;下一份清单——伽马射线激光器、深空推进、原子级 3D 打印 "物理能实现的东西,都不是魔法" --- 🎤 主播与嘉宾 谢学军 | UCSB 半导体博士,胡正明院士联合创始人;公司聚焦 2D TMD 材料的低温 MOCVD 设备 + 基于 TSMC PDK 的下一代 IP 设计;同时主导数字永生项目 The Pantheon,科幻小说《Pantheon Racing》作者;学《大学》《中庸》,把灵魂当硬件来思考。 AI-Nate | 硅谷 AI 工程师,18 周打造 18 个 AI Agent 产品,AI 课程导师;前半导体行业从业者(ALD/CVD/PVD/Etch),所以这一期他和谢学军在工艺细节上对得上号。 --- ⏱️ 时间戳 00:00 开场 & 嘉宾介绍 01:27 公司在做什么:低温 MOCVD 设备 + 2D 材料 IP 02:35 为创业而读博:非典型硅谷 PhD 路径 06:30 与胡正明院士的一封 cold email 09:00 为什么 2D:把沟道做薄,硅会碎,TMD 不会 11:25 亚纳米级量子点阵列:电子束在 2D 上"写"出固态 quantum well 15:00 Monolithic 3D:低温 2D 让传统硅做不到的梦想变现实 17:30 Product Market Fit:低成本 prototype 哲学 20:00 拿着锤子找钉子,才是创新的真相 23:00 AI 拉低 Token + 黄仁勋的 10 亿程序员 25:30 The Pantheon 首次公开:数字永生 = AGI 时代的 Human Safeguard 29:00 为什么是 10 万人?集体智能比单一 AGI 更安全 31:00 用金融工具支付未来的 Token 消费 32:00 跨星际文明:光速运送的是意识 36:00 集体意识 / 三体的"3 对人" / 田渊栋《破晓之钟》 40:00 灵魂是硬件、肉身是 UI 43:00 跟中和先生彭仲学儒学:从唯物主义到对意识保持敬畏 47:00 梦中见到从未读过的书:现有物理数学解释不了的"现象" 50:00 各学科的终极是哲学:禅修"正见"与 Yann LeCun 的世界模型 53:00 拉马努金、Roger Penrose 的量子大脑、AI 是"礼盒" 58:00 给 PhD 的三条建议:想象力、不设限、project-based learning 01:05:00 五年后再听:还会做同样的决定 01:06:00 下一份清单:伽马射线激光器 + 深空推进 + 原子级 3D 打印 01:07:00 物理能实现的东西,都不是魔法 / 收尾 --- 📮 联系我们 播客邮箱:nathan@ai-nate.com 欢迎评论区留言交流,转发支持! --- 🎙️ 「硅谷洞察局」听友群开放中!扫码进群,和 Nathan 直接聊,认识同样关注 AI、半导体和硅谷动态的朋友们。 --- 📚 嘉宾科幻清单 谢学军把公司未来要做的产品都写进了科幻小说《Pantheon Racing》——原子级技术 × 数字永生 × 跨星际文明的世界观入口。 英文版(Amazon):https://www.amazon.com/dp/B0FCDCZ24S 中文版(豆瓣阅读):https://read.douban.com/ebook/726863167/ --- 🎁 听众福利|AI Superpower 第三期早鸟开放 如果你听完这期心里冒出一个念头——"我也想自己造点东西",那这门课就是为你准备的。 Nathan 在 Maven 开的 3 周直播课《AI Superpower:Build Your One-Person Company》第三期已经开放报名。课程会带你从 0 搭一支属于自己的 Agent Crew,把过去需要一整支团队才能跑的事——写代码、做产品、跑 GTM、做客服——交给 AI 来跑。你只负责给方向、看结果。 适合谁:想做 side project、想跑独立产品、不想等大公司点头才动手的工程师 / 产品人 / 创业者。不需要 AI 背景,需要的只是想动手的那点冲劲。 📅 6 月 8 日开课 · 共 3 周 · 直播 + 录播 🎟️ 早鸟票 EARLYBIRD20 八折,5 月 11 日截止 👉 报名:https://maven.com/ai-nate/ai-superpower?promoCode=EARLYBIRD20
前 DeepMind 研究员、前百度无人车负责人:每个人都将成为 CEO,AI 会拥有 100 台云电脑🎙️ 硅谷洞察局 EP09 | 前 DeepMind 研究员、前百度无人车负责人:每个人都将成为 CEO,AI 会拥有 100 台云电脑 一线洞察,深度思考。硅谷核心科技从业者,带你触摸 AI 变革深处。 --- 📌 本期看点 当 OpenAI、Anthropic 还在卷大模型,市面上人人都在做 Browser Use 和 API Agent 的时候,有一家硅谷创业公司,从 2023 年成立第一天起就只啃一块最硬的骨头——让 AI 像人一样,用鼠标和键盘真正地"操作"电脑。 这家公司就是 Simular AI,创始人李昂——前 DeepMind 研究员、前百度阿波罗北美无人车团队负责人。本期我们请到他,聊聊为什么他们要选择最难、最反直觉的那条路,以及今年 3 月发布的新产品 Sai (赛) 背后的世界观:每个人都将成为 CEO,云端会有 100 台电脑同时为你工作。 这是一场关于 Computer Use Agent 本质、AGI 路线图、和创业反共识的深度对谈。 --- 💬 本期金句 "如果一件事情真的非常顺其自然,那一定是有问题的——因为我们觉得顺其自然,其他人也会觉得。" —— 00:38:08 "agent 的对手是人类世界——是人的生活习惯。" —— 00:44:46 "创业公司很多成功,都是因为他没有尝试去改变(用户),而是在已有工作流上提升。" —— 00:45:33 "先打平人,你再谈怎么超越——你连鼠标都点不了,还谈什么 AGI?" —— 00:47:00 "AI 如果想更进一步,首先应该先假设自己是人,去做这些事,再谈别的。" —— 01:14:43 "最终每个人都会变成公司 CEO,你会有 100 台云电脑帮你做事。" —— 00:31:00 "DeepMind 不能 own 产品——这就是我必须出来创业的核心原因。" —— 01:13:00 "最终极的产品就是:我都不知道它存在,但它把事情帮我做了。" —— 01:30:53 --- 📖 本期术语速查(听到不熟悉的词?翻这里) Computer Use Agent(电脑操作智能体):能像人一样移动鼠标、敲键盘、点击屏幕来完成任务的 AI Agent。区别于只调用 API 的 Agent。Simular 是这个赛道全球最早的玩家之一。 Browser Use Agent(浏览器操作智能体):专门在浏览器里点链接、填表单、抓数据的 Agent。门槛比 Computer Use 低,做的人多。 OS World:学术界评估 Computer Use Agent 能力的标准 Benchmark,几百个真实操作系统任务(Word、Excel、Chrome 扩展安装等)。Simular 在 2024 年 12 月成为全球第一家在该榜单上达到人类水平(72.4 分)的公司。 Pass@K vs Pass^K:两种衡量 Agent 成功率的方式。Pass@K 是"K 次中至少 1 次成功",适用于写代码;Pass^K 是"K 次必须全部成功",一次错就算错——这才是真实业务场景需要的可靠性标准。 Sai(赛):Simular 在 2025 年 3 月发布的产品——给每个人在云端配一台 Windows PC,Agent 可以 7×24 替你操作它。现在已经支持自带电脑,一个 workspace 可以挂多台。 Always-on Co-worker(永远在线的同事):Sai 的产品定位,不是工具,而是一个不会下班的 AI 同事,在云端持续替你工作。 Harness Engineering(执行框架工程):管理 Agent 任务流、上下文、出错恢复的"脚手架"。Simular 在 2024 年 10 月开源了业界第一个 Computer Use Agent Harness——比 Anthropic 的 Computer Use 早了一周。 MCP vs CLI:MCP(Model Context Protocol)是为 Agent 专门设计的协议;CLI 是给人用的命令行。本期讨论:为什么 2024 年大火的 MCP 在 2025 年被 CLI 反超?——因为大模型是用互联网上(为人写的)数据训练的,CLI 数据多到爆。 Lifelong Learning(终身学习):李昂在 DeepMind 时期的核心研究方向。AGI 必须像人一样实时学习——白天像 Harness 不停记笔记,晚上 replay 训练改变权重。 --- 🗂️ 内容大纲 一、Simular 的"反共识"基因 2023 年第一个 Demo:CEO 在机场远程操控发布会现场的电脑 为什么不做 Browser Use 也不做 API?——故意挑最难的 2024 年开源 Agent Harness:比 Anthropic Computer Use 早一周 二、Computer Use 的本质与难点 GUI 不会消失——这个世界的基建是为人造的,Agent 必须适应 视觉定位、长工作流的累积错误、Pass^K 的可靠性陷阱 为什么打款多 10 倍这种错误,99% 成功率也无法容忍 三、OS World 人类水平意味着什么 李昂团队 2024 年 12 月达到 72.4 分,首次平人 但这只是研究里程碑,真实场景需要 Multi-turn 交互、Human-in-the-loop God Will 机制:Agent 在不可逆操作前必须停下来等审批 四、Sai 产品哲学:云端 100 台电脑 每个人都成为 CEO,云端会有 100 台电脑同时工作 为什么选 Windows?——全球最大装机量 + 微软合作 跟微软是 Frenemy:都做 AGI,但产品 DNA 不同 惊喜 Use Case:Fund Manager 自动 monitor 投资组合、二手车 Dealer 批量处理 100 张 DMV 注册 五、为什么 Computer Use > API 不是所有软件都会 API 化(老旧系统、DMV……) Vibe Coding 让 GUI 也变多了——API 和 GUI 是同时增长的 人不是机器——视觉信息维度更高,GUI 是有用的 人最终为结果负责,不可能把所有 permission 全交给 Agent 六、MCP vs CLI 的逆转 为什么"为 Agent 设计的 MCP"被"为人设计的 CLI"打败? 数据决定一切——大模型在互联网数据(全是为人写的)上训练 AI 想进步,先假设自己是人 七、Token 浪费与 ROI 困境 Nathan 一天烧 600 美金、推特账号被 Agent 群发禁掉的真实经历 ROI 太低=资源浪费,这是限制下一个 10 倍的最大瓶颈 模型能力会持续提升,但 efficiency 还远远不够 八、从 DeepMind 到创业:为什么必须出来 2016 年 Facebook AI Research 已经预见 Scaling Law DeepMind 不能 own 产品 → 没有完整闭环 → AGI 实现不了 终身学习需要 Agent + 用户反馈 + reflection 闭环——大厂里搭不起来 九、给 AI 研究员/大厂员工的建议 Storytelling 能力:把图像式的想法转换成逻辑语言 Apple 的细节执念:VP 会亲自把午餐三明治按种类分类 写代码烂大街了——人的价值在 design taste、product sense、对细节的把控 每个人都得 generalist:程序员要懂产品,设计师要会写代码 十、推荐产品:Granola(管它拉) 为什么记笔记这么"小"的产品能打动一个 CEO 无声的产品形态——不需要 Chatbot 那种"陌生人开场白"的尴尬 最好的产品:用户感知不到它的存在,但事情都被做了 --- 🎤 主播与嘉宾 李昂 | Simular AI 创始人 & CEO,前 Google DeepMind 研究员(终身学习方向),前百度阿波罗北美无人驾驶团队负责人,前Facebook AI 研究员。Computer Use Agent 赛道全球最早的开拓者之一。 AI-Nate | 硅谷 AI 工程师,18 周打造 18 个 AI Agent 产品,AI 课程导师 AI-Siky | 斯坦福毕业,10年+硅谷经验,曾主导多家独角兽增长,现任顶级科技公司战略合作负责人 --- ⏱️ 时间戳 00:00 开场 & 嘉宾介绍:Simular AI 创始人李昂 00:43 2023 年的第一个 Demo:CEO 在机场操控发布会现场 03:30 业界第一家 Computer Use 公司——比 Anthropic 早一年 06:00 为什么 Simular 不自己训练大模型? 09:00 Computer Use 的本质:让电脑自动化,而非只是鼠标键盘 12:00 视觉定位、长工作流——为什么 Agent 难 14:00 Pass@K vs Pass^K:打款多 10 倍就要被开除 16:00 API 和 GUI 的辩论:为什么不只用 API? 19:00 为什么人和 AI 应该和谐共存,而非完全替代 22:00 OS World 72.4 分:研究里程碑 vs 现实落地 25:00 Multi-turn 交互 + Human-in-the-loop = 真实场景 28:00 Nathan 真实案例:推特被 Agent 刷屏导致封号 31:00 Sai 的产品哲学:每个人 100 台云电脑 34:00 反直觉创业战略:不做 Low-hanging fruit 38:00 创业公司一定要找别人解不了的难问题 40:00 用户惊喜:Fund Manager + 二手车 Dealer 的真实 Use Case 43:00 GUI 不会消失——基建是为人造的 46:00 创业核心洞察:Agent 的对手是人类的生活习惯 47:00 AGI 路线图:先打平人,再谈超越 48:00 MCP 为什么被 CLI 反超?——数据为王 51:00 微软合作:Frenemy 关系如何处理 54:00 下一个 10 倍的瓶颈:Token 效率与 ROI 57:00 Nathan 烧 600 美金的故事 & Token 优化心得 01:00:00 终身学习:从 2016 Facebook 到 DeepMind 的研究主线 01:05:00 进化算法 + 强化学习——为 AGI 铺路 01:08:00 人脑假说:白天做 Harness,睡觉时 Replay 训练 01:13:00 为什么必须离开 DeepMind:大厂不能 own 产品 01:16:00 给 AI 研究员的建议:学会 Storytelling 01:19:00 Apple 4 年的 Lesson:对细节的执念 01:22:00 写代码烂大街后,人的价值在哪? 01:25:00 generalist 时代:每个人都要变 CEO 01:28:00 推荐产品 Granola:无声的产品形态 01:32:00 结语 & 感谢 --- 📮 联系我们 播客邮箱:nathan@ai-nate.com 欢迎评论区留言交流,转发支持! --- 🎙️「硅谷洞察局」听友群开放中! 👉 扫码进群,和 Nathan、Siky 直接聊 🎯 告诉我们下期你想听什么 🤝 认识同样关注 AI 和硅谷动态的朋友们 --- 🎁 听众福利 👉 试用 Sai:simular.ai(支持邀请码注册) 想亲手体验 Vibe Coding?Nathan 开设了一堂免费快闪课程——从零开始,用 Cursor + Claude Code 搭建你的第一个 AI 项目。不需要编程基础,跟着做就行。 👉 免费报名:Agentic Coding Zero-to-Shipped
AI视频赛道硅谷领跑者HeyGen副总裁:一路狂奔拿下的最强商业落地方向🎙️ 硅谷洞察局 EP08 | AI视频赛道硅谷领跑者HeyGen副总裁:一路狂奔拿下的最强商业落地方向 一线洞察,深度思考。硅谷核心科技从业者,带你触摸AI变革深处。 --- 📌 本期看点 AI 数字人已经不是科幻——阿根廷总统米莱用它做 175 种语言的全球演讲,宝格丽用它做全球员工培训,一条本来要好莱坞团队、10 万美金、4 周才能做出的品牌片,现在一句 prompt 就能生成。 本期嘉宾是硅谷 AI 数字人头部公司 HeyGen 的工程副总裁刘斌——硅谷 15 年,Pinterest 近 10 年做到 Director。去年他带创业团队整体加入 HeyGen,理由很简单:AI 时代,小公司已经招不到顶尖人才了。 就在我们录完节目的第二天(4 月 18 日),HeyGen 开源了节目里深聊的新项目 HyperFrame ——让 AI 用"写代码"的方式做视频——一夜之间在 X 刷屏。这期节目帮你了解这场风暴幕后的故事。 我们聊了:为什么所有 AI 创业公司都可能被 AGI 一把抹掉、HeyGen 员工的 Slack 一半是真人一半是 AI、以及一个最扎心的问题——当 AI 可以 24 小时替你出镜,内容创作者还剩什么? --- 💬 本期金句 "沟通视频是一个极其巨大且极其 underserved 的市场——它不 sexy,但远远没被开发。" —— 00:17:56 "除了英语之外,什么是 Agent 的母语?就是 Code。" —— 00:21:48 "视频编辑这件事,如果用 AI Native 的方式做,它不是 Editing Problem,是 Codegen Problem。" —— 01:03:18 "不只是 HeyGen,任何 Startup 都有可能被那个最先达到 AGI 的公司 wipe out。" —— 00:30:50 "Canva 没有技术护城河——但它有 2.5 亿月活。为什么?" —— 00:32:02 "我们通宵干了 48 小时,仍比别人慢 4 小时——在 Twitter 上可能就少了 50 万播放。" —— 00:37:34 "招一个人最重要的一点:你能不能成为这家公司的一个 Pivot Point。" —— 00:58:58 "在一个人的 career 里,能做一件真正定义一个行业的事,是极其难得的。" —— 01:07:31 --- 📖 术语速查 Avatar / AI 数字人:AI 生成的虚拟人,能模仿真人脸、声、表情——抖音、视频号里很多"主播"就是 Avatar。 HyperFrame(HeyGen 4/18 刚开源):Hypertext + Frame。让 AI 用"写网页代码"的方式做视频,节目录完第二天在 X 上刷屏。 AGI Wipe Out:AGI 一旦出现,很多今天有护城河的公司会瞬间失去价值。刘斌坦言 HeyGen 也不例外。 Seedance 2.0 / Veo 3 / Kling:当前最强的 AI 视频模型,分别来自字节、Google、快手。HeyGen 是 Seedance 2.0 北美独家整合平台之一。 Land Grab Mode:硅谷 AI 行业现在的状态——谁先上线、谁先占据用户心智,谁就赢。 Unit Economics:每获一个用户赚多少、花多少。AI 产品每次用都烧算力钱——这也是 OpenAI Sora 关停消费端的核心原因。 Pivot Point:刘斌招人哲学——一个人出现就能改变公司走向的人,才值得高薪抢。 --- 🗂️ 内容大纲 一、从 Pinterest 到 HeyGen:一个硅谷老兵的再出发 - 硅谷 15 年,Pinterest 近 10 年管产品+设计+工程 - 自己创业 2 年后带团队整体加入 HeyGen - 决策逻辑:AI 时代小公司招不到顶尖人才 + 行业正在整合(Graphite→Cursor、Windsurf→Google) 二、HeyGen 做的不是好莱坞,是"沟通视频" - 别人都在打 cinematic,HeyGen 打 Avatar + 沟通场景 - 客户案例:阿根廷总统米莱、宝格丽 - 14 天把一段内容分发成 175 种语言 三、Code as Video:HyperFrame 的秘密 - Agent 不擅长用 Premiere / AE(为人设计的)也不会改 XML - 视频本质 ≈ 一个带动效的网页 → 让 Agent 直接写 HTML 代码 - 一条 10 万美金、4 周的好莱坞品牌片,现在一句 prompt 搞定 四、为什么 HeyGen Avatar 比 Veo 3 / Sora 更适合商用 - Veo 3 每 8 秒开始"drift"(人物走样),HeyGen 通过复用关键帧解决 - 1 分钟视频成本 < 1 美元(Veo / Seedance 8 秒就要 1 美元) 五、AGI Wipe Out:应用层的生存哲学 - HeyGen 也可能被抹平——任何 Startup 都会 - 应用层 baseline:比 OpenAI 更懂用户(CEO 每天聊 1 个客户) - 长期必须做 network effect——Canva 靠模板生态,不是技术 - Cursor 的危机:Claude Code、Codex、Antigravity 都在抢它蛋糕 六、Land Grab Mode:硅谷现在拼的是速度 - Seedance 2.0 上线,HeyGen 是 4 家拿到首批 API 的公司之一 - 慢 4 小时 = 少 50 万播放 - HeyGen 霸榜时间线:Video Translate → Avatar IV → Video Agent 七、Sora 为什么关停?AI 消费产品的致命难题 - 传统消费互联网边际成本为零,AI 产品每次使用都烧算力 - 解法:Edge Computing + 小模型 + 高性能终端,2-3 年可期 - 为什么工具向 AI 产品成功率更高:LTV 算得清楚 八、AI Native Workforce:HeyGen 内部怎么运作 - 公司 Slack 一半是 Agent、一半是真人 - 用代码、网页、视频替代 PPT 和 Doc 做内部汇报 - Incident Review 压缩成 1 分钟视频,工程师上厕所就能看完 - 招人只看一点:你能不能成为公司的 Pivot Point 九、两个 Big Bets & 创业者的初心 - Bet 1:HyperFrame 开源成为 AI 视频时代的事实标准 - Bet 2:Avatar Identity 成为一个全新的资产类别 - 动力:"能做一件 define industry 的事,是极其难得的" --- 🎤 主播与嘉宾 刘斌|HeyGen 工程 VP:硅谷 15 年,Pinterest 早期员工并工作近 10 年至 Director;CMU 校友,与 HeyGen CEO 张帅是大学同班同学;自己创业 2+ 年后带团队整体加入 HeyGen。 AI-Siky:斯坦福毕业,10 年+硅谷经验,曾主导多家独角兽增长,现任顶级科技公司战略合作负责人。 AI-Nate:硅谷 AI 工程师,18 周打造 18 个 AI Agent 产品,AI 课程导师。 --- ⏱️ 时间戳 00:00 开场 & 嘉宾介绍 02:00 为什么从自己创业转向加入 HeyGen 06:40 HeyGen 做的不是好莱坞,是企业沟通视频 07:30 客户案例:阿根廷总统米莱、宝格丽 10:00 Avatar IV:14 天分发 175 种语言 17:30 "Code 是 Agent 的母语" 18:30 HyperFrame 揭秘:视频 = HTML 代码 22:00 10 万美金品牌片 vs 一条 Prompt 23:00 Avatar 为什么比 Veo 3 更适合长视频 27:30 Foundation Model vs Application Layer 的博弈 30:50 "任何 Startup 都可能被 AGI Wipe Out" 32:00 Canva 护城河不是技术,是模板生态 35:00 Land Grab Mode:Seedance 2.0 抢先上线 37:34 "通宵 48 小时仍慢了 4 小时 = 少 50 万播放" 46:30 Sora 为什么关停:AI 消费产品的 Unit Economics 难题 56:47 上一波(Pinterest/Uber)vs 这一波 AI 创业体感 58:58 招人哲学:能不能成为 Pivot Point 59:30 AI Native Workforce:Slack 一半是 Agent 01:03:18 "视频编辑是一个 Codegen Problem" 01:03:50 两个 Big Bets:HyperFrame + Avatar Identity 01:07:55 "我不想停下来,我也永远不会停下来" 总时长:约 1:10:00 --- 📮 联系我们 播客邮箱:nathan@ai-nate.com 欢迎评论区留言交流,转发支持! --- 🎙️ 「硅谷洞察局」听友群开放中!扫码进群,告诉我们下期你想听什么。 --- 🎁 听众福利 想亲手体验节目里的 Code as Video、AI Native Workforce?Nathan 在 5 月 2 日(周六) 开一场 2 小时动手工作坊——「Build Your First AI Agent in 2 Hours」,用 Cursor + Claude Code 搭建你的第一个 AI Agent。不需要编程基础。 听众专属:优惠码已嵌入下方链接,立享 20% OFF 👉 maven.com
硅谷天才少女CEO如何在AI多模态应用实现增长奇迹 - 三年近亿美金营收🎙️ 硅谷洞察局 EP07 | 硅谷天才少女CEO如何在AI多模态应用实现增长奇迹 - 三年近亿美金营收 一线洞察,深度思考。硅谷核心科技从业者,带你触摸AI变革深处。 --- 📌 本期看点 当所有人都在谈论 AI 创业时,有一个华人女性创始人已经悄悄把事情做成了。本期,我们来到 OpenArt 的 Hacker House 现场,对话 CEO & Co-founder Coco Mao(毛科淳)——前 Google 7年老兵,卡耐基梅隆大学本科计算机出身,2022年创办 OpenArt,三年做到近亿美金 ARR、800万月活用户。 她聊了很多"不那么光鲜亮丽"的真实创业故事:为什么在 GenAI 时代"拿着锤子找钉子"反而是对的?为什么不要过早定义 ICP?为什么 Startup 不是死于竞争,而是死于自杀?以及,她正在筹备的 5 月重磅产品发布——一个 Agentic 的端到端视频创作体验。 这不是 PR 稿里的创业故事,是在 Hacker House 里、身边工程师还在加班时录下的一线实录。 --- 💬 本期金句 "在 GenAI 领域创业有点 counterintuitive——你不要过早定义你的 ICP,因为技术在变,市场在变,过早框死自己会 miss opportunities。" —— 06:22 "团队之间有问题,morale 不好,这才是真正杀死你的东西。" —— 39:57 "当 model 越来越强大的时候,你应该感到 excited 还是害怕?这个问题能告诉你,你的产品到底是不是在跟 model 竞争。" —— 19:51 "以前每周都换一个 idea,做了一周 prototype 就上线——三个月后 ChatGPT 爆了,我们才觉得这个东西好像是有点什么东西的。" —— 15:30 "我们想做 AI 时代的 Canva——不是专门给 professional filmmaker 用的,而是让 non-professional 做出 professional 质感的内容。" —— 29:00 "如果你在想「我是不是应该 fire 这个人」,想了大概三次,那估计就是你应该 fire 的。" —— 45:54 "你要想象加州淘金热——在水里的人比在岸上看的人更可能挖到金子。身处其中,你才能观察到机会。" —— 54:01 --- 📖 本期术语速查(听到不熟悉的词?翻这里) ICP(理想客户画像) 你最想服务的目标用户群体。传统创业建议是越早定义越好,但 Coco 认为在技术剧变期不要过早框死。 Micro Pivot(微转向) 不是大的战略转型,而是根据技术发展和市场反馈做出的小幅方向调整。OpenArt 每年都会做几次 Micro Pivot。 Visual Storytelling(视觉叙事) 用图像、视频等视觉手段讲故事。OpenArt 的核心 mission 是让人人都能做视觉叙事。 Model Aggregator(模型聚合器) 整合多个 AI 模型(如 Flux、Stable Diffusion、Veo 3 等)供用户选择使用的平台。Coco 认为纯聚合价值有限,需要在此之上构建更多工作流价值。 Agentic Workflow(智能体工作流) 让 AI Agent 自主完成端到端的创作流程(脚本撰写→素材生成→后期编辑),而非让用户逐步手动操作。OpenArt 2026 年的核心方向。 Node-based Workflow(节点式工作流) 类似 ComfyUI 的可视化编排方式,用户拖拽节点构建工作流。Coco 认为这更适合 professional,不符合 democratize 的 mission。 World Model(世界模型) 能理解和模拟 3D 世界的 AI 模型。OpenArt 接入了李飞飞团队的 World Labs 模型,推出 Open Worlds 功能,让用户在虚拟世界中选取角度和运镜。 Beat Sync(节拍同步) AI 分析音乐节奏后,让视频画面切换与音乐节拍精确同步。OpenArt Music Video 产品的核心技术之一。 Go-to-Market / GTM(市场进入策略) 产品如何触达用户、获取增长的策略。OpenArt 早期靠 SEO 和域名优势冷启动,后扩展到 Influencer Marketing、社媒运营等多渠道。 SMB(中小企业) OpenArt 的重要用户群体之一。这些企业需要在社交媒体上运营账号、制作内容,但通常没有专业设计或视频团队。 --- 🗂️ 内容大纲 一、从谷歌到创业:前谷歌人的AI创业起点 • 卡耐基梅隆大学本科计算机 → 谷歌7年 → 2022年8月创办OpenArt • ChatGPT爆发前三个月入场,每周换一个想法快速验证 • 技术巨变时代,"拿着锤子找钉子"反而可行 二、不要过早定义目标用户 • 技术和市场都在变,过早框死会错过新兴人群 • 从"什么人都来生图"到聚焦视觉叙事的演进 • 以不变应万变:抓住人类不变的表达欲和叙事需求 三、三年三次微转向:图片 → 视频 → 智能体 • 2022-2024:图片生成起步,搜索优化冷启动 • 2024试水视频 → 太贵质量不够 → 砍掉;2025视频模型突破 → 重新投入,爆发增长 • 2026:全力押注智能体工作流,5月重磅发布 四、模型越强,我们越兴奋——护城河思考 • 纯模型聚合价值有限,真正价值在端到端创作链路 • 电影类比:视频模型只是摄影师,还需要编剧、剪辑、音效 • 坦诚反思:工作流层面很难有壁垒,需要生态和飞轮 五、对标Canva:普惠化的产品哲学 • Canva七成用户不是设计师 → 让普通人做出专业质感 • 节点式 vs 智能体驱动:选择后者,测试效果更优 • 音乐视频:上传一首歌 → AI分析歌词节奏 → 自动生成MV 六、Sora关闭、世界模型与竞争格局 • Sora关闭是OpenAI自身战略调整,视频市场依然很好 • 模型公司做内容平台行不通:基因不同,缺运营 • 接入李飞飞团队世界模型,推出虚拟片场功能 • 不担心大公司,更关注其他创业公司——迭代速度是优势 七、增长飞轮:从百万到接近一亿美金 • 百万 → 千万(12个月)→ 1700万(2025)→ 接近一亿(2026) • 增长是阶梯式的:找到爆发点 → 平缓 → 再找点 → 再爆发 • 获客矩阵:搜索优化 → 网红营销 → 社媒运营 → 广告 八、团队治理:快速淘汰、不要过度优化、找对人 • "想了三次要不要开这个人,那就该开了" • 管理随规模迭代:5人无流程,10人建流程,50人学放权 • AI改变团队结构:以前20个工程师,现在4-5个就够 • 最好的人才来自熟人推荐,不是猎头 九、未来愿景:从工具到生态 • 目标上市,不考虑被收购 • 短期深耕工具,视频是万亿美金市场 • 长期探索AI原生的消费体验,从工具变生态 • 5月重磅发布 + 101高速公路广告牌已预定 --- 🎤 主播与嘉宾 Coco Mao(毛科淳)| OpenArt AI CEO & Co-founder,卡耐基梅隆大学本科计算机,前 Google 7年(搜索 / Area 120 / Tangi),ACM ICPC Top 10,LinkedIn Women in Tech Scholarship。2022年创办 OpenArt,三年做到 800万月活、近亿美金 ARR、50人团队。 AI-Siky | 斯坦福毕业,10年+硅谷经验,曾主导多家独角兽增长,现任顶级科技公司战略合作负责人 AI-Nate | 硅谷AI工程师,18周打造18个AI Agent产品,AI课程导师 --- ⏱️ 时间戳 00:00 开场介绍 00:43 嘉宾自我介绍:谷歌7年到创办OpenArt 01:15 营收增长历程:从百万到接近一亿美金 03:04 用户画像:受众远比想象中广 04:34 音乐视频产品:节拍同步与歌词分析 05:27 今年方向:从单个素材生成到端到端智能体 05:45 三年创业历程拆解 06:17 反直觉:不要过早定义目标用户 08:32 以不变应万变:为什么聚焦视觉叙事 11:56 拿着锤子找钉子,在技术巨变时代反而可行 14:00 获客策略:搜索优化冷启动与网红营销 15:24 创办三个月后ChatGPT爆发,乘上浪潮 16:16 从图片到视频:竞争与市场空间 17:07 几个关键微转向节点 17:44 增长不是线性的:爆发→平缓→再爆发 19:17 大模型厂商下场做工作流怎么办? 19:50 模型越强,你是兴奋还是害怕? 21:28 电影制作类比:模型只是摄影师 24:04 诚实反思:工作流层面很难有护城河 25:00 速度是最大优势 27:33 节点式还是智能体驱动? 29:00 对标Canva:七成用户不是专业设计师 32:33 Sora关闭意味着什么?视频市场依然很好 35:12 世界模型与虚拟片场 37:15 不担心大公司,更关注其他创业公司 39:27 创业公司不是死于竞争,而是死于内耗 40:33 招人三标准:好奇心、学习力、主人翁意识 42:23 AI改变团队结构:工程师要有产品思维 44:40 管理随规模迭代,不要过度优化 45:33 招错人怎么办?想了三次就该开 47:33 从事无巨细到学会放权 48:33 未来愿景:上市,从工具走向生态 50:33 寻找AI原生的消费体验 53:33 淘金热类比:在水里的人才能挖到金子 55:00 五月重磅发布预告 55:56 招聘联系方式 56:23 结语 --- 📮 联系我们 播客邮箱:nathan@ai-nate.com OpenArt 招聘:careers@openart.ai 欢迎评论区留言交流,转发支持! --- 🎙️ 「硅谷洞察局」听友群开放中! --- 🎁 听众福利 想亲手体验 Vibe Coding?Nathan 开设了一堂免费快闪课程 👉 免费报名:Agentic Coding Zero-to-Shipped
出海元老独角兽PingCap创始人:Agent打开了平行世界,将撼动人类文明🎙️ 硅谷洞察局 EP06 | 出海元老独角兽PingCap创始人:Agent打开了平行世界,将撼动人类文明 一线洞察,深度思考。硅谷核心科技从业者,带你触摸AI变革深处。 --- 📌 本期看点 GTC 之后,Agent 浪潮正在从概念变成每天的工作方式。本期,我们请到了 PingCAP 联合创始人 & CTO 黄东旭——一位九岁开始写代码、操盘过超30亿美金估值开源数据库公司的硅谷技术人,聊聊他这三个月里真实发生的事情。 他一个人,在过去三个月里完成了传统意义上几十个人一年的工作量;每天 Token 消耗峰值达到十亿级别;彻底取消所有内部会议,把 AI Agent 当作真正的"团队"来管理。 这不是 PPT 里的 AI 故事,是一个在第一线跑着的人,给你的第一手报告。 --- 💬 本期金句 "以前是手写代码,现在是管理 Agent 团队在写代码。" —— 00:01:48 "Anthropic 认为这个世界是可以被编程的,于是把编程放在了至高无上的位置——这就是为什么今天一切都是编程 Agent。" —— 00:07:00 "人类那点小小小小小聪明,放在模型面前,这真的是不值得一提。" —— 00:14:02 "把 Claude Code 当做一个操作系统内核来看,你就会看到更大的世界。" —— 00:15:34 "Vibe Coding 上瘾之后,第一停不下来,第二你会对跟人类沟通慢慢失去耐心——效率太低了。" —— 00:59:47 "99% 的时候可能都在说车轱辘话,但会有 1% 的时候灵光一闪——只要那句金句出现,所有 Agent 马上都知道。" —— 01:12:00 "我不喜欢编程,我喜欢造物。这一波,才是真正的解放。" —— 01:17:44 "你今天所有觉得宝贵的、exclusive 的能力和资源,很快就会被磨平。我也一样。" —— 01:21:54 "只有满身大汗,真的学木工做个小桌子——这种实实在在的存在,才是最抚慰人心的东西。" —— 01:24:46 --- 📖 本期术语速查(听到不熟悉的词?翻这里) Agent / AI Agent(智能体) 不只是聊天的 AI,而是能自主写代码、调用工具、完成复杂任务的 AI。可以把它理解为"有手有脚、能干活的 AI 员工"。 Vibe Coding(氛围编程) 用自然语言描述你想要什么,让 AI 来写代码,人只负责提需求和审结果。不需要懂具体语法,靠"感觉"驱动开发。 Coding Agent(编程智能体) 专门用来写代码的 AI Agent。代表产品:Claude Code、Cursor、Devin。 Harness Engineering(执行框架工程) 把多个 AI Agent 组织起来协同工作的"脚手架"——管理任务分配、上下文传递、Agent 之间的通信。东旭本期大量讨论的核心主题。 Token(词元) AI 模型处理语言的最小单位,可以理解为"AI 读了多少字"。消耗 Token 越多 = 干的活越多,也越贵。东旭说他峰值每天消耗十亿 Token。 Slock.ai(Slack for Agents) 东旭投资并使用的一个工具,把多个 AI Agent 放进一个"群聊"里协同工作——类似人类用 Slack 开会,但里面全是 AI 在讨论和干活。 Skill(技能包) 写给 AI Agent 的一段 Markdown 说明文档,告诉 Agent 在特定场景下应该怎么做事。可以理解为"AI 的工作手册",也是 Agent Native App 的早期形态。 SaaS(软件即服务) Software as a Service,按订阅收费的云端软件。比如 Salesforce(客户管理)、ServiceNow(IT 流程)、Slack(团队沟通)都是 SaaS。本期讨论它们正在被 Agent 颠覆。 CLI vs GUI CLI(命令行界面)= 黑屏打字操作,比如终端;GUI(图形界面)= 鼠标点击的可视化界面,比如 Windows。东旭认为 AI Agent 更擅长 CLI,因为组合灵活,不需要"看图"。 Postgres(PostgreSQL) 一种流行的开源关系型数据库,已成为数据库行业的"通用语言"。东旭的 DB9 兼容 Postgres 接口,意味着 AI Agent 可以用熟悉的方式操作它。 Unix Philosophy(Unix 哲学) 1970年代诞生的软件设计理念:每个程序只做一件事,做好它;程序之间可以自由组合。东旭认为这一哲学在 AI Agent 时代正在复兴。 IC(Individual Contributor,独立贡献者) 不带团队、自己亲手干活的技术人员。东旭去年12月主动放弃管理职责,回归 IC 状态,专注用 Agent 团队直接交付产品。 Organic(自然增长) 不花钱投广告,靠口碑和产品体验自然获客。东旭说 DB9 是他做过增长最快、且完全 0 营销费用的产品。 Result as a Service(结果即服务) 新兴商业模式:不卖软件,直接对业务结果收费。比如"帮你多签了几单合同,按成交额抽成",而不是"卖给你一套 CRM 系统"。 --- 🗂️ 内容大纲 一、2025 年是一道分水岭 大模型从"灵活的 Wiki"变成"有手有脚的 Agent" Claude Code、Cursor、Devin:第一代 Coding Agent 工具爆发的技术根源 Anthropic 为什么是这场浪潮的设计者?——把编程放在至高位置的世界观 二、Claude Code 不是工具,是操作系统内核 用 OS 内核的视角重新理解 Claude Code "Context not Control":越精妙的编排越是在限制模型 从 Claude Code 泄露事件看:Harness 的真正价值在哪里? "做梦"机制:用极简设计管理 Agent 记忆 三、Harness Engineering 的真实体感 东旭的 Agent 团队实战:Slock.ai(Slack for Agents)是什么? 把 AI 当真正的工程师团队来管:签到、Review、分组、绩效…… 99% 的对话是废话,但那 1% 的"金句"价值连城 人类的角色:从"写代码"变成"看结果 + 给方向" 四、传统 SaaS 的危机与机会 SaaS 本质是在卖"人与人之间的摩擦成本" 为什么东旭两周复刻了一个 Salesforce? Agent 时代:新的 App Store 来了,但还没有 SDK Result as a Service:谁能说清楚自己对业务 outcome 的影响,谁才能活下去 五、DB9:为 Agent 造一个数据库 当 90% 的数据库 Instance 由 AI 创建,产品要怎么重新设计? Big Data 消亡论:为什么"坐在个人数据上的 Agent"比大数据分析更强? Agent 基础设施三件套:DB9(数据库)、Drive9(网盘)、Message9(邮件) 零 Marketing,增长却是有史以来最快——好产品的自然裂变 六、一个程序员的三次技术浪潮 Unix 哲学的冲击:为什么70年代的哲学正在复兴? 分布式系统思维方式的塑造 AI Native 的顿悟:充分相信一个比你更高的智能 "我不喜欢编程,我喜欢造物"——这一波才是真正的解放 七、给所有人的建议 别信 KOL,自己动手玩:Claude Code 就是最好的起点 比技术更重要的事:用身体和这个世界产生真实连接 Agent 用多了会有虚无主义?——木工、种花、乐器,才是解药 --- 🎤 主播与嘉宾 黄东旭 | PingCAP 联合创始人 & CTO,9岁开始自学编程,小学毕业自学完了大学计算机所有内容;深度 Harness Engineering 实践者,每日 Token 消耗十亿级,Agent 时代基础设施建造者 AI-Siky | 斯坦福毕业,10年+硅谷经验,曾主导多家独角兽增长,现任顶级科技公司战略合作负责人 AI-Nate | 硅谷AI工程师,18周打造18个AI Agent产品,AI课程导师 --- ⏱️ 时间戳 00:00 开场 & 嘉宾介绍:PingCAP 联创 CTO 黄东旭 00:43 东旭的三重身份:工程师 / 企业家 / 艺术爱好者 02:35 2025 分水岭:大模型从 Chatbot 变成 Agent 05:00 Anthropic 的战略世界观:一切可编程 07:00 Anthropic 为什么赢了?与 OpenAI、Google 的路线对比 10:00 Claude Code 泄露事件:没有什么好惊讶的 13:00 两种 Harness 路线:精心编排 vs 充分相信 AI 15:00 "做梦"机制:Claude Code 的记忆设计哲学 17:00 OS 内核视角:把 Claude Code 当发动机 19:00 Skill 是 Agent Native APP 的早期形态 22:00 APP Store 时刻:寒武纪大爆发正在来临 25:00 东旭的实战:3个月 = 几十个人一年的工作量 29:00 为什么今年底会出现统一标准? 33:00 Slock.ai(Slack for Agents):东旭的 Harness 工具 37:00 Agent 团队管理:签到、绩效、金句时刻 40:00 人类当 HR:只看 outcome,不读过程 43:00 传统 SaaS 的死亡逻辑 47:00 东旭两周复刻 Salesforce:但 integration network 抄不走 49:00 Self Build vs SaaS 转型:谁会赢? 54:00 DB9:为 Agent 造一个数据库 57:00 Big Data 消亡论:个人数据 Agent > 大数据分析 01:02:00 Drive9 & Message9:Agent 基础设施矩阵 01:05:00 没有看到边界:DB9 从实验变成正经项目 01:07:00 Agent 团队里的"金句时刻":安全漏洞被自己发现 01:10:00 任何方案至少迭代5轮——东旭的 SPEC 设定 01:13:00 现在花钱的正确姿势:Claude Max 两天用完 01:16:00 东旭的三次技术浪潮:Unix / 分布式 / AI Native 01:20:00 "充分相信一个更高的智能"——AI Native 的核心顿悟 01:24:00 Agent 安全不需要专门做——告诉他注意就行了 01:28:00 AI 真正的民主化:我妈也能做供销管理系统 01:33:00 "我不喜欢编程,我喜欢造物" 01:38:00 每天可以做什么:自己动手 + 回到物理世界 01:42:00 东旭收尾:满身大汗才是解药 01:44:00 结语 & 感谢 --- 📮 联系我们 播客邮箱:nathan@ai-nate.com 欢迎评论区留言交流,转发支持! --- 🎙️ 「硅谷洞察局」听友群开放中! 👉 扫码进群,和 Nathan、Siky 直接聊 🎯 告诉我们下期你想听什么 🤝 认识同样关注 AI 和硅谷动态的朋友们 --- 🎁 听众福利 想亲手体验 Vibe Coding?Nathan 开设了一堂免费快闪课程——从零开始,用 Cursor + Claude Code 搭建你的第一个AI项目。不需要编程基础,跟着做就行。 👉 免费报名:Agentic Coding Zero-to-Shipped
斯坦福毕业、两次成功并购——她亲历AI如何杀死SaaS🎙️ 硅谷洞察局 EP05 | 斯坦福毕业、两次成功并购——她亲历AI如何杀死SaaS 一线洞察,深度思考。硅谷核心科技从业者,带你触摸AI变革深处。 --- 📌 本期看点 2026年开年至今,全球软件股蒸发超过一万亿美元。一张在LinkedIn和X上疯传的图——"2027: The Software Death Cross"——画出了两条正在交叉的曲线:SaaS估值持续下坠,AI市场规模加速上冲。 本期节目,Siky以亲历者身份拆解SaaS行业的真实运作逻辑。他曾在硅谷带领两家SaaS公司,一家成功上市,一家被ServiceNow数十亿美金收购。从RPA(古早版Agent)到IT Chatbot,从按人头卖席位到被AI吊打灰色地带,Siky和Nate一起回答一个核心问题:SaaS到底哪里在死,哪里还能活,以及未来3到5年最大的机会在哪。 --- 🗂️ 内容大纲 一、一张图讲清SaaS的困境 "2027: The Software Death Cross"到底在说什么 SaaS估值从疫情高点18.5x跌至4.8x的完整时间线 ChatGPT、Claude Co-worker、Vibe Coding三个关键节点如何加速下坠 二、一个SaaS老兵的一线叙事 Siky的第一家公司:RPA——古早版Agent,年营收从1亿做到5亿美金 按席位收费的真相:Bot利用率不饱和,自动化流程有限,增长遇到天花板 Siky的第二家公司:IT Chatbot嵌入Slack/Teams,2007年创立,被ServiceNow数十亿收购 ServiceNow为什么要花大价钱买一个"技术上不算黑科技"的公司 三、为什么按人头收费注定被淘汰 SaaS按席位定价的本质:卖方市场下的灰色地带 AI正在把这些灰色地带拿出来"吊打"——原来值100块的东西,现在只值50 从"躺着赚钱"到"跪着赚钱":SaaS溢价权的消失 Vibe Coding双重绞杀:需求端Agent替代人力,供给端软件无限复制 四、GenSpark vs Claude Code:产品力才是新护城河 Siky实测对比:用Claude Code做PPT vs 用GenSpark做PPT,体验差距巨大 GenSpark背后的秘密:不是AI更强,是产品把设计师级别的审美沉淀成了wrapper "套壳"不等于没价值——真正的套壳是把行业know-how产品化 交互方式决定生死:每次技术浪潮都会诞生新的交互形式,谁先发现谁赢 微软为什么没做好AI版PPT 五、数据与Skill:下一代SaaS的真正壁垒 硅谷大厂要求员工用Claude Code生成Skill,人走了知识留下 Memory + Skill库:不是静态AI,而是越用越强的进化型AI 从fine-tune垂直模型到沉淀行业know-how:技术壁垒的重新定义 OpenClaw式的Agent Harness如何让know-how变成可复用资产 六、ToB采购流程的颠覆 传统路径:麦肯锡定蓝图 → 采购Snowflake → 埃森哲做部署,环环相扣 AI初创公司的瓶颈:产品力够了,但go-to-market、客户关系、咨询伙伴生态跟不上 从Top-down到Bottom-up:当定价从人头变成结果,真正的使用者开始拥有话语权 Harvey(AI法律,估值110亿)的启示:垂直know-how + 技术 = 快速起量 七、大胆设想:中国ToB的第二春 中国SaaS为什么一直做不起来:老板太实在,人力太便宜 AI让企业服务"走向实在"——中国老板反而可能比美国职业经理人跑得更快 AI形式的外包:取代传统外包公司,直接交付结果 创始人 vs 职业经理人:谁在AI转型中更有优势 八、终局判断:谁吃掉最大的蛋糕 Anthropic可能成为AI时代的微软——从技术公司到ToB生态霸主 传统SaaS巨头不会死,但会以传统公司的估值重新定价 中而美的AI-native公司会在垂直领域跑出来,但天花板明确 为Agent而造的基础设施:数据、交互、Infra三大蓝海 ToB与ToC的融合:个人Agent成为统一入口,工作与生活的边界消失 --- 🎤 主播 AI-Nate|硅谷AI工程师,18周打造18个AI Agent产品,AI课程导师 AI-Siky|斯坦福毕业,10年+硅谷SaaS经验,曾主导RPA独角兽上市及IT SaaS公司被ServiceNow收购,现任顶级科技公司战略合作负责人 --- 🔗 相关资源 2027 Death Cross原图讨论(LinkedIn/X热传) ServiceNow官网:servicenow.com GenSpark:genspark.ai 上期回顾(EP04):谷歌DeepMind研究员揭秘:Coding模型是怎么炼成的,模型上限在哪 --- ⏱️ 时间戳 00:20 开场:一张疯传的图——2027 SaaS死亡交叉 01:50 Siky背景介绍:两家SaaS公司,一家上市一家被收购 02:20 RPA:古早版Agent,年营收从1亿到5亿美金 04:20 按席位收费的真相:Bot利用率不饱和 07:20 第二家公司:IT Chatbot嵌入Slack/Teams 09:20 被ServiceNow数十亿收购的幕后故事 12:20 ServiceNow的PE为什么那么高 14:20 传统SaaS采购的完整链条:麦肯锡 → 产品 → 埃森哲 18:20 Vibe Coding为什么让SaaS加速崩塌 20:20 AI初创公司的天花板:从几千万到几亿的瓶颈 25:20 go-to-market的人才和关系壁垒 27:20 Harvey(AI法律)估值110亿的启示 30:20 fine-tune模型 vs 沉淀know-how:技术壁垒在转移 33:20 OpenClaw / Claude Code的Skill沉淀模式 37:20 GenSpark vs Claude Code做PPT:产品力差距实测 42:20 "像打造苹果产品一样做PPT"的Prompt技巧 45:20 AI做PPT不是15分钟搞定——马拉松式人机协作 49:20 GenSpark的平台模式:从PPT切入,吃掉长尾场景 51:20 微软为什么没做好这件事 53:20 从Top-down到Bottom-up:采购决策权的转移 56:20 中国SaaS为什么做不起来:老板太实在 59:20 大胆设想:AI让中国ToB重新点燃 1:04:20 AI形式的外包:取代传统外包公司 1:07:20 中国创始人 vs 美国职业经理人:谁转型更快 1:10:20 Anthropic会成为AI时代的微软吗 1:15:20 终局:几个大玩家 + 一批垂直领域中而美公司 1:20:20 为Agent而造的基础设施:三大蓝海方向 1:25:20 ToB与ToC的融合:个人Agent成为统一入口 1:28:20 给创业者和投资人的建议 1:31:20 总结与展望 --- 📮 联系我们 播客邮箱:nathan@ai-nate.com 欢迎评论区留言交流,转发支持! --- 🎙️ 「硅谷观察局」亲友群开放啦! 听了这么多期,是不是有时候想跟我们聊几句? 我们开了一个听友微信群,欢迎你来: 💬 和Nathan、Siky直接交流讨论 🎯 告诉我们下期你想听什么话题 🎬 了解录制背后那些没播出来的趣事和翻车现场 🤝 认识同样关注AI和硅谷动态的朋友们 👉 前200名直接扫码加群(见图片) 我们群里见! --- 🎁 听众福利 想亲手搭建你自己的AI Agent?Nathan开设了一堂免费快闪课程——从零开始,用Cursor + Claude Code搭建你的第一个AI项目。不需要编程基础,跟着做就行。 👉 免费报名:Agentic Coding Zero-to-Shipped
谷歌DeepMind研究员揭秘:Coding模型是怎么炼成的,模型上限在哪🎙️ 硅谷洞察局 EP04 | 谷歌DeepMind研究员揭秘:Coding模型是怎么炼成的,模型上限在哪 一线洞察,深度思考。硅谷核心科技从业者,带你触摸AI变革深处。 --- 📌 本期看点 英伟达GTC大会刚刚落幕,大模型在过去半年经历了一轮又一轮的迭代。本期节目,我们请到了前Google DeepMind资深研究员Warren Chen——一位在coding agent方向深耕多年、现已投身创业的一线技术人,和我们做了一场关于大模型训练范式演化的硬核技术对谈。 从Pre-training到RLHF,从Verifiable Feedback到Mid-Training,从Harness Engineering到Agent Environment——Warren用"看课本、做习题、考试"的类比,把大模型训练的三次范式跃迁讲得通透。如果你想理解为什么Coding Agent突然爆发、为什么Anthropic能持续领先、以及创业者该押注什么方向,这期不容错过。 --- 📖 本期术语速查(听到不熟悉的词?翻这里) Pre-training(预训练):让AI把互联网上海量文字都"看"一遍,相当于通读所有课本 SFT(监督微调):给AI做示范题,手把手告诉它"这道题应该这么答" RLHF(人类反馈强化学习):请人类给AI的两个回答打分,AI学着挑人更喜欢的那个 RLVF(可验证反馈强化学习):不用人打分了,直接对答案。代码跑通就是对,没跑通就是错 Chain-of-Thought(思维链):让AI像人一样"先想一想再回答",而不是直接蹦出答案 Mid-Training(中间训练):只教AI答题的格式(怎么填答题卡),不教具体解法,让它自己悟 Reward Signal(奖励信号):告诉AI"你这次做对了还是做错了"的反馈 Harness(执行框架):AI模型和真实世界之间的脚手架,帮AI接住任务、管理记忆、处理出错 Environment(执行环境):AI能触达的所有工具和权限——邮箱、浏览器、代码编辑器、操作系统等 Scaling Law(规模定律):模型越大、数据越多、算力越强 → AI能力越强,这条规律目前仍然成立 Benchmark(基准测试):AI界的"高考模拟卷",用标准化测试对比各家模型的分数 Agent(智能体):不只是聊天的AI,而是能自主写代码、发邮件、操作软件、完成复杂任务的AI Superhuman(超越人类):AI在某个领域的表现超过了最优秀的人类专家 --- 🗂️ 内容大纲 一、大模型训练的三次范式跃迁 第一阶段:人类当老师(2022-2023) 三步流程:先通读课本(Pre-training),再做随堂练习(SFT),最后请人类老师批改作文、打分(RLHF) ChatGPT为什么让人惊艳?两件事做对了:你说什么它能照做(Instruction Following),而且说话方式让你觉得舒服 瓶颈在哪?人类老师再厉害也是人。用人打分训练出的AI,天花板就是人类水平本身 第二阶段:机器自己出题考自己(2023-2024) 核心变化:把"请人打分"换成"直接对答案"。数学题算出86.736就是86.736,代码跑通就是跑通,不需要人来判断 为什么数学和Coding最先突破?因为它们天然满足三个条件:答案可以验证、不能靠猜、过程必须正确才能得出正确结果 Chain-of-Thought(思维链)从一个prompt技巧,变成了模型自己会做的事。以前你得在提示词里写"请一步步思考",现在模型自己就会先想再答 Coding能力 + 思维链能力同时提升,互不干扰 → 这就是去年Coding Agent突然爆发的技术根源 第三阶段:只教姿势,不教答案(2024至今) 以DeepSeek R1为代表的新范式:SFT阶段不再教AI怎么解题,只教它"把答案写在花括号里"这种格式要求。类比:只教天才怎么填答题卡,不告诉他选A还是选B 为什么?因为人类的解题思路反而会成为天才的负担。你教他高中数学的做法,他可能用微积分一步就解出来了 真正的学习全部发生在RL阶段:AI自己做题、自己验证、自己进化。人类只提供题目和判分规则 这是AI第一次真正有可能超越所有人类专家。The Bitter Lesson(苦涩的教训)的完美印证:少干预,多放手,让算力和数据自己说话 二、Coding为什么是通往AGI的钥匙? Coding不是目的,是Agent能力的最佳近似(best proxy) 你不能直接训练Agent,但可以通过Coding训练Agent能力 把任何问题转化为Coding Problem = 吃到未来两年AI红利 视频剪辑(Remotion)、UI设计(Pencil)、数据分析都可以被Coding表达 100%效率提升 → 用工具;1000%效率提升 → 围绕工具重构工作流 三、为什么Anthropic一直领先?各家差距在哪? 研究员视角拆解三大壁垒: 壁垒一:Pre-training(科学问题,Scaling Law需要慢慢做,急不来) 壁垒二:数据质量(Moving Target,今天有用的数据明天就太简单了) 壁垒三:Evaluation(Superhuman能力怎么测?SWE-bench已经失效) Anthropic数据飞轮的真正含义:不是直接用用户数据,而是从用户行为中提取North Star Codex + GPT 5.4 vs Claude Opus:Opus是组里不说话的大神,Codex是最后抢功的TL Google的护城河:人才密度、现金流、芯片到算法的垂直整合 四、Harness会消失吗?Agent的终局在哪? 三层模型:Foundation Model → Harness → Environment Harness = 脚手架(context压缩、任务续接、to-do维护、early termination) 暴论:Harness是过渡产物,中间层会越来越薄,被两端吃掉 模型变强吸收上层,大厂API吸收下层(memory、compaction最终会被内置) OpenClaw的两大洞察:无限Environment + Agent Identity(24/7持续存在的智能体,而非用完即弃的Ghost Intelligence) 五、创业者该怎么选方向? 第一步:用第一性原理预测未来3-6个月,不要用后验经验 第二步:想清楚不变的商业规律——Brand、Scale、Network Effect、Embedding "When everything changes, nothing changes" 两个最看好的方向:Agent Environment(造路和桥)、Agent Identity(IAM第四层) 不要站在基座模型对立面:不做"模型不够好所以我来补"的生意 Build for a beautiful future model:假设模型更强更便宜时,你的产品是否依然有价值 不要有Producer Illusion:iPhone已经来了,别想着造iOS,去造App --- 🎤 主播与嘉宾 AI-Nate|硅谷AI工程师,18周打造18个AI Agent产品,AI课程导师 AI-Siky|斯坦福毕业,10年+硅谷经验,曾主导多家独角兽增长,现任顶级科技公司战略合作负责人 Warren Chen|前Google DeepMind资深研究员,Coding Agent方向,现创业中,LinkedIn链接:https://www.linkedin.com/in/chenweilunster/ --- 🔗 相关资源 DeepSeek R1论文:deepseek.com Remotion(用React写视频剪辑):remotion.dev 上期回顾(EP03):龙虾潮背后Skill经济的崛起-饥饿游戏或成现实! EP02回顾:深度拆解Anthropic:一个物理系学生如何造出硅谷最危险的AI公司(小宇宙爆款) --- ⏱️ 时间戳 00:00 开场 & 嘉宾介绍:前Google DeepMind研究员Warren 00:43 英伟达GTC大会背景 & 本期主题 02:35 第一阶段:Pre-training + SFT + RLHF,大模型训练的经典三步 06:30 RLHF详解:人类打分的Reward Model是怎么工作的 08:48 RLHF的天花板:人类反馈永远无法训练出Superhuman 10:14 第二阶段:从RLHF到RLVF,数学领域的突破 13:00 两条分叉路径:Coding Reward + Chain-of-Thought 15:33 Chain-of-Thought:从prompt技巧到模型内生能力 18:00 Coding + CoT正交融合 → Coding Agent大爆发 19:33 第三阶段:Seed Not Teach,Mid-Training范式革命 22:00 DeepSeek R1案例:只教格式,不教内容 26:00 培养天才的方法论:不要用普通学生的套路 29:26 The Bitter Lesson的完美印证 31:30 研究员现在关注什么?更好的习题 + 更好的评估 33:00 Anthropic为什么能持续领先?数据飞轮的真正含义 39:00 把任何问题转化为Coding Problem = 吃到AI红利 43:00 实例:Remotion用React写视频剪辑 46:00 100% vs 1000%效率提升:用工具 vs 围绕工具建工作流 48:00 大模型竞争格局:各家在Coding上你追我赶 49:30 Coding不是目的,是通往Agent能力的最佳近似 50:50 为什么道理都懂却过不好?三大壁垒解析 51:00 壁垒一:Pre-training是科学+工程问题,急不来 55:00 壁垒二:数据质量是Moving Target 58:00 壁垒三:Evaluation——Superhuman能力怎么测? 59:00 SWE-bench的局限性 & IDE范式 vs Agent范式 1:01:00 Codex + GPT 5.4 vs Opus:哪个才是最强Coding模型? 1:04:30 OpenAI = Mid-Training纯粹派,Anthropic = SFT精修派 1:07:00 Harness是什么?Foundation Model → Harness → Environment 1:15:00 Harness实例:任务续接、Context压缩、To-do维护 1:18:00 暴论:Harness是过渡产物,中间层会消失 1:22:00 Environment才是终局:谁控制环境,谁控制Agent 1:24:00 OpenClaw的核心洞察:Environment + Agent Identity 1:26:00 IAM第四层:Agent不应该用人类的身份体系 1:28:00 产品应该给Agent用,不是给人用——Token消耗量10-100倍 1:30:00 创业两步走:第一性原理 + 不变的商业规律 1:33:00 "When everything changes, nothing changes" 1:36:00 不要站在基座模型的对立面 1:38:00 Build for a beautiful future model 1:42:00 快问快答:每天用什么AI工具?推荐论文?入行建议? 1:44:30 收尾 & 感谢 --- 📮 联系我们 播客主页:https://ai-nate.com/podcast/ (附视频版地址) 播客邮箱:nathan@ai-nate.com 欢迎评论区留言交流,转发支持! --- 🎙️ 「硅谷观察局」亲友群开放啦! 听了这么多期,是不是有时候想跟我们聊几句? 💬 和Nathan、Siky直接交流讨论 🎯 告诉我们下期你想听什么话题 我们群里见! --- 🎁 听众福利 想亲手体验 Vibe Coding?Nathan 开设了一堂免费快闪课程——从零开始,用 Cursor + Claude Code 搭建你的第一个AI项目。不需要编程基础,跟着做就行。 👉 免费报名:Agentic Coding Zero-to-Shipped
前Google工程师:一个人用AI写500万行代码后,我发现程序员的新货币变了🎙️ 硅谷洞察局 EP03 | 前Google工程师:一个人用AI写500万行代码后,我发现程序员的新货币变了 一线洞察,深度思考。硅谷核心科技从业者,带你触摸AI变革深处。 --- 📌 本期看点 全民养虾潮席卷中国——腾讯百度搞活动,退休老人排长队装龙虾,Kimi两周收入超过去一年。OpenClaw(龙虾)到底是什么?它为什么比DeepSeek还火? 本期节目,Nate和Siky邀请前Google工程师、二次创业者CJ,从龙虾热潮的本质、AI平权的幻觉、Skills经济的崛起三个维度,深度拆解这场席卷中美的AI Agent革命。 --- 🗂️ 内容大纲 一、龙虾热潮全景:到底发生了什么? OpenClaw在中国的爆发路径:从程序员圈子到全民养虾 龙虾盒子 vs 云端龙虾:一个是智商税,一个方向很对 Kimi两周收入超过去一年——云端虚拟机的暴利生意 飞书意外成为最大受益者:开放API的长期回报 IM是所有东西的入口:不管做什么,最后都得连到手机上 二、龙虾的本质:Agent不再是房产经纪人 在龙虾之前,Agent = Coding Agent(一个for循环调大模型) OpenClaw指明了方向:让所有人知道Agent长什么样 类比DeepSeek:开源打开新范式,一个在模型层,一个在Agent层 马化腾宣布5-6个龙虾产品即将上线 三、真实养虾故事:从炒股到教妈妈 Nathan让妈妈养虾——她真以为要用AI养虾🦐 CJ朋友:亚马逊卖家兴奋到凌晨2点,把AI当工作buddy Nathan用龙虾炒股:Paper mode第一天赚$30 龙虾的情绪价值:看两只虾打架的老板式成就感 四、灵魂拷问:AI到底让谁平权了? Siky观点:在科技圈内被高度平权 Nathan观点:极度不平权——你从1到10,有人从1到10000 顶尖程序员也不写代码了,差别只剩"你会不会说话" Anthropic付费加速 = 用钱买intelligence Sam Altman两年前就说了:政府要向AI公司征税,实现UBI 五、Skills:最近几年最伟大的发明之一 SaaS → Skills as a Service:不是卖工具,是卖结果 炒股Skill的悖论:好Skill永远不该分享(教会徒弟饿死师傅) Excel将被彻底吃掉:VLOOKUP再也没有人学了 Skill做生意可以,做大公司很难 红杉洪山:"Skill is the new software" 六、Harness > Model:别再争哪个模型好了 Harness概念:给模型画个圈,达到条件才能出来 同样的模型 + 不同的Harness = 完全不同的结果 员工把锅推给大模型?其实是Harness没做好 企业龙虾的核心问题:权限隔离(CEO龙虾 vs 员工龙虾) 七、IDE之死与Anthropic的飞轮 Cursor还用吗?"卸了。" Anthropic的数据飞轮:Coding产品产出高质量结构化训练数据 人类历史从未发生:一个流程在半年内被彻底改变 Go语言创始人Rob Pike都投降了 八、前沿思考:当一切都不重要了 公司在找Superhuman:一个人做四个人的活,其余被裁 Jeffrey Hinton的警告:大模型之父远离人群 同理心成为最重要的能力 当工作和金钱不再重要,活着的意义是什么? CJ:"去经历。Follow内心最深处最想做的事。" --- 🎤 主播 AI-Nate|硅谷AI工程师,18周打造18个AI Agent产品,AI课程导师 AI-Siky|斯坦福毕业,10年+硅谷经验,曾主导多家独角兽增长,现任顶级科技公司战略合作负责人 🎤 本期嘉宾 CJ|北大计算机系,前Google工程师,创业项目被快手收购,现硅谷二次创业。Claude Code重度用户,AI辅助写了500万行代码。 --- ⏱️ 时间戳 00:00 开场 & 嘉宾CJ介绍 01:36 龙虾潮到底是什么?中国比硅谷更疯狂 03:00 CJ回顾龙虾一个月的发展脉络 04:09 龙虾盒子:淘宝预装机,装上龙虾价格翻倍 05:09 云端龙虾:Kimi、MiniMax卖云端虚拟机 05:53 Kimi两周收入超过去一年 💰 06:22 CJ直言:龙虾盒子大概率是智商税 06:56 本地 vs 盒子 vs 云端(微信扫码、小红书反爬) 08:17 本质是个人生产力Agent 09:19 Agent定义被滥用——在湾区大家以为是房产经纪人 10:14 CJ:所有Agent本质都是Coding Agent 11:27 龙虾最大的作用:让所有人知道Agent长什么样 11:44 类比DeepSeek:开源指路 12:53 OpenClaw的Channel概念 13:26 飞书意外成为最大受益者 15:33 IM是所有东西的入口 17:09 马化腾宣布5-6个龙虾产品 17:33 Nathan让妈妈养虾的翻车故事 🦐 18:28 CJ朋友:亚马逊卖家兴奋到凌晨2点 21:12 Nathan让龙虾炒股(Paper mode赚$30) 22:46 龙虾的情绪价值:看两只虾打架的成就感 23:33 CJ为什么不用龙虾? 24:20 龙虾 = Claude Code的Consumer版 27:58 灵魂拷问:AI让世界更平还是更不平? 29:58 Nathan:非常不平权 31:17 你从1到10,有人从1到10000 33:33 差别只剩"你会不会说话" 35:59 Anthropic付费加速 = 用钱买intelligence 36:56 Sam Altman:政府要向AI公司征税 → UBI 37:27 龙虾会昙花一现吗? 39:33 创业方向讨论 41:03 Skills = 你最大的资产 43:33 炒股Skill的悖论:好Skill不能分享 46:33 Excel将被Coding Agent吃掉 48:16 没有人再学VLOOKUP了 50:33 Skill做生意 vs 做大公司 52:28 Harness概念:给模型画个圈 54:50 重点在Harness,不在模型 57:33 CJ的创业:给公司养多只龙虾 59:33 企业龙虾 vs 个人龙虾:权限是关键 1:02:33 红杉洪山:"Skill is the new software" 1:04:33 Anthropic的数据飞轮 1:06:33 Cursor还用吗?"卸了。" 1:08:33 人类历史上从未发生:半年改变一个流程 1:10:33 Go语言创始人Rob Pike投降 1:14:33 饥饿游戏:公司找Superhuman 1:17:33 Jeffrey Hinton的警告 1:22:33 给下一代的建议 1:24:04 同理心是最重要的能力 1:28:30 活着的意义 1:31:33 CJ:去经历 1:33:33 总结与结束 --- 🔗 相关资源 OpenClaw官方:https://github.com/openclaw/openclaw 上期回顾(EP02):Anthropic深度拆解——一个物理系学生如何造出硅谷最危险的AI公司 --- 📮 联系我们 播客邮箱:nathan@ai-nate.com 欢迎评论区留言交流,转发支持! --- 🎙️ 「硅谷观察局」亲友群开放啦! 听了这么多期,是不是有时候想跟我们聊几句? 我们开了一个听友微信群,欢迎你来: 💬 和Nathan、Siky直接交流讨论 🎯 告诉我们下期你想听什么话题 🎬 了解录制背后那些没播出来的趣事和翻车现场 🤝 认识同样关注AI和硅谷动态的朋友们 👉 前200名直接扫码加群(见图片) 我们群里见! --- 🎁 听众福利 想亲手体验 Vibe Coding?Nathan 开设了一堂免费快闪课程——从零开始,用 Cursor + Claude Code 搭建你的第一个AI项目。不需要编程基础,跟着做就行。 👉 免费报名:Agentic Coding Zero-to-Shipped
深度拆解Anthropic:一个物理系学生如何造出硅谷最危险的AI公司🎙️ 硅谷洞察局 EP02 | Anthropic深度拆解:一个物理系学生如何造出硅谷最危险的AI公司 一线洞察,深度思考。硅谷核心科技从业者,带你触摸AI变革深处。 --- 📌 本期看点 过去两周,Anthropic站上了全球风口浪尖——CEO Dario Amodei公开拒绝五角大楼的AI使用条款,特朗普随即威胁将其列入政府禁用名单。这家成立仅4年、年营收已达200亿美金的AI公司,到底是什么来头? 本期节目,Nate和Siky从产品矩阵、创始人生平、技术实力、公司文化四个维度,深度拆解Anthropic——一家让硅谷开发者和华尔街同时震动的AI公司。 --- 🗂️ 内容大纲 一、Anthropic是谁?核心产品梳理 Claude AI(对话)、Claude Code(编程)、Cowork(知识工作者)三大产品线 从Research Lab到ToB/ToD的商业化路径 Co-worker如何撼动SaaS行业 Opus、Sonnet、Haiku三款模型命名背后的艺术隐喻 二、五角大楼事件:到底发生了什么? 美国军方选中Anthropic的来龙去脉 Dario坚守的两条红线:拒绝大规模监控(Mass Surveillance)、拒绝全自动武器部署 特朗普政府的强势回应与潜在影响 "甲方爸爸"翻脸——合情合理还是过度理想? 三、灵魂人物:Dario Amodei的非典型AI之路 物理学出身,非计算机科班 父亲早逝 → 五年攻克罕见疾病(治愈率50%→95%) 从百度超级实验室(吴恩达团队)入行AI Google → OpenAI VP of Research → 创立Anthropic 理想主义者 vs 商人:AI安全宪章的由来 四、为什么Claude模型这么强?开发者视角深度体感 Opus 4.6 vs GPT 5.3:真实切换对比 不只是写代码——System Design级别的推理能力 模型的"个性"与"Taste":不讨好用户,会Challenge你 AI训练AI:Synthetic Data与自我迭代的加速飞轮 Benchmark ≠ 体感:为什么跑分不等于好用 五、Anthropic的公司文化与护城河 一周开会不超过2小时,极度放权 核心团队极其稳定——走的人少,去的人多 Constitutional AI作为旗帜吸引同频人才 开发者与专业用户的高质量反馈数据壁垒 六、前沿思考:AI的下一步在哪? Chain of Thought的局限性 大胆设想:能否让模型权重(Weights)在推理时动态变化? 当模型不知道自己知道——第四层认知能力的涌现 Scaling Law还在成立吗?Dario说"远没到边界" --- 🎤 主播 AI-Nate|硅谷AI工程师,18周打造18个AI Agent产品,AI课程导师 AI-Siky|斯坦福毕业,10年+硅谷经验,曾主导多家独角兽增长,现任顶级科技公司战略合作负责人 --- 🔗 相关资源 Anthropic官网:anthropic.com Claude产品体验:claude.ai Constitutional AI论文:Anthropic官方博客 上期回顾(EP01):Vibe Coding 生存指南:一个人指挥20个AI,淘汰的不是程序员,是不会用AI的人 --- ⏱️ 时间戳 00:00 开场 & 本期主题预告 00:30 Anthropic与五角大楼事件概述 03:30 Anthropic公司与产品介绍(Claude AI / Code / Co-worker) 07:00 Co-worker vs Claude Code的区别 11:00 Opus / Sonnet / Haiku模型解析 13:00 五角大楼事件详细梳理 18:00 Dario的两条红线:大规模监控 & 全自动武器 22:00 公众理解 vs 事实真相 24:30 Dario Amodei生平:物理学 → 医学 → AI 30:00 百度超级实验室:AI生涯起点 34:00 从OpenAI出走到创立Anthropic 37:00 为什么Anthropic人才极其稳定? 41:00 Nate探访Anthropic办公室的体感 44:30 开发者深度体感:Opus 4.6为何最强 50:00 GPT 5.4发布对标分析 53:00 Benchmark vs 体感:为什么跑分不代表好用 55:00 Claude模型的推理与System Design能力 59:00 AI训练AI:自我迭代的飞轮 1:03:00 AI模拟用户做PMF验证的实验 1:07:00 律师案例:专业人士反馈对模型的价值 1:11:00 前沿思考:权重动态变化与AGI 1:17:00 总结与展望 --- 📮 联系我们 播客邮箱:nathan@ai-nate.com 欢迎评论区留言交流,转发支持! --- 🎙️ 「硅谷观察局」亲友群开放啦! 听了这么多期,是不是有时候想跟我们聊几句? 我们开了一个听友微信群,欢迎你来: 💬 和Nathan、Siky直接交流讨论 🎯 告诉我们下期你想听什么话题 🎬 了解录制背后那些没播出来的趣事和翻车现场 🤝 认识同样关注AI和硅谷动态的朋友们 👉 前200名直接扫码加群(见图片) 我们群里见! --- 🎁 听众福利 想亲手体验 Vibe Coding?Nathan 开设了一堂免费快闪课程——从零开始,用 Cursor + Claude Code 搭建你的第一个AI项目。不需要编程基础,跟着做就行。 👉 免费报名:Agentic Coding Zero-to-Shipped
Vibe Coding 生存指南:一个人指挥20个AI,淘汰的不是程序员,是不会用AI的人🎙️ 硅谷洞察局 EP01 | Vibe Coding 生存指南:一个人指挥20个AI,淘汰的不是程序员,是不会用AI的人 一线洞察,深度思考。硅谷核心科技从业者,带你触摸AI变革深处。 --- 在AI重塑世界的此刻,硅谷正在发生什么? 硅谷洞察局,由两位身处变革中心的科技从业者共同发起。我们不做二手资讯的搬运,只分享一线视角、真实体感与深度思考。 --- 主理人 Siky 斯坦福毕业,扎根硅谷10年 从0到1,作为增长负责人连续带领两家AI创业公司成长为数百亿独角兽,最终被科技大厂收购。 深度参与硅谷AI商业化全链路,亲历模型落地、融资增长、战略合作、并购整合的每一个关键节点。 现在头部科技公司负责战略合作,持续站在行业最前沿。 硅谷AI商业化圈子里,罕见的中国面孔。 主理人 Nate 硬件工程师出身,横跨硬件、软件、产品管理三重背景。 在硅谷头部科技公司深耕AI与操作系统,亲手触碰从芯片到应用的完整链路。 18周连续打造18个AI Agent产品,是硅谷最早一批将AI Agent从概念推向实战的实践者。 同时在硅谷教授AI课程,帮助上千人从零构建自己的AI Agent。 坚信下一个时代属于AI Agent——不是人学会用AI,而是AI学会替人做事。 硅谷AI Agent赛道上,少有的既能写代码、又能讲清楚的人。 --- 我们的洞察局聊什么? * 硅谷AI公司的真实生存状态 * 大模型商业化的机会与陷阱 * 硅谷AI前沿趋势与判断 * 创业、增长、并购背后的故事 将定期筛选邀请藏在硅谷的技术大牛与各领域专家,带来第一手洞见——咀嚼最新认知,直击AI变革前沿。 在硅谷洞察局,一起看见未来。 本期节目是一场来自硅谷一线的深度对话。Nathan(17周连续shipping AI产品的独立开发者)和朋友从 Vibe Coding 的起源聊到它对个人、初创公司和大厂的深远影响。不是泛泛而谈——是真正在用AI写代码、做产品、养活自己的人,分享最真实的体感。 --- 🎯 核心观点 "不是谁替代谁的问题,是谁能把跨行业泛化做得好的问题。" "你不够忙,所以不用AI。公司的策略就是——逼着你忙到不得不用。" "以前花几个月才能迭代一个产品,现在一周一个,甚至按分钟迭代。" --- ⏱️ 时间线 00:00:20 — 什么是 Vibe Coding? Andrej Karpathy 的那条推文如何定义了一个时代 00:04:47 — Nathan 的 Vibe Coding 演变史: 从 GitHub Copilot → Cursor → Claude Code,三个阶段的真实体感 00:08:21 — Claude Code + 多Agent编排: 一个人开6个窗口并行开发,再进化到让AI管AI 00:10:53 — Anthropic/OpenAI内部: 一个研究员带10-30个Agent工作已成常态 00:12:53 — 角色融合大趋势: PM觉得不需要程序员,程序员觉得不需要PM,设计师觉得谁都不需要 00:16:53 — "Taste"才是核心竞争力: 工具一样,但切入视角不同,产品天壤之别 00:19:22 — Power User时代: 不分职业背景,谁能跨界泛化谁就赢 00:22:36 — Nathan的17周挑战: 每周一个production-ready产品,不是demo 00:25:53 — "不要想太多,直接做": Build → Learn → 融会贯通的实战方法论 00:26:22 — 实战心法: 在做的过程中学,不要事先准备太久 00:30:25 — Vibe Coding 真的这么容易吗? 对零基础的人来说,真实的学习曲线 00:31:55 — Token消耗能力 = 新时代生产力: Minus AI创始人的洞察——你能驱动多少AI同时工作? 00:34:55 — 个人记忆库系统: 为什么Nathan一年来持续构建自己的memory系统,以及它如何成为护城河 00:36:55 — 变现的真相: 生产速度快了10倍,但Go-to-Market的链路没变——怎么破? 00:45:27 — B2B vs B2C的AI赋能: 用AI做marketing、PPT、甚至sales outreach 00:48:55 — OpenClaw深度解析: Peter的Secret Sauce不是技术创新,是成百上千次的问题驱动迭代 00:55:22 — AI Framework → AI Harness: 从"教AI用锤子"到"让AI自己造工具"的范式转变 00:57:17 — The Bitter Lesson: Rich Sutton的论文为什么是Anthropic和OpenAI的内部圣经 01:07:55 — Square裁员40%的信号: 硅谷第二波裁员潮即将到来 01:12:55 — "你不够忙,所以不用AI": 公司正在用裁员倒逼员工拥抱AI 01:15:55 — 这辆车开到哪了? 硅谷处于8-30的中早期阶段,还远没到终点 01:21:22 — 给所有人的建议: Build → Learn → Teach,高中生都能做到,你也行 01:24:55 — Building in Public: 为什么每个人都需要自己的流量入口 --- 📌 提到的工具和资源 Vibe Coding工具: Claude Code, Cursor, GitHub Copilot 底层模型: Claude (Anthropic), GPT (OpenAI), Gemini (Google) AI Agent框架: OpenClaw (开源个人AI助手) 必读论文: The Bitter Lesson — Rich Sutton (2019) 关键人物: Andrej Karpathy, Boris (Claude Code之父), Peter (OpenClaw创始人) --- 💡 金句 "公司不养闲人。一份工资 + Token,比三份工资划算。" "以前是给AI一个工具箱;现在是给AI编程能力,让它自己造工具。" "你的context window也有限——把积累的东西交给AI,自己专注当下最有价值的问题。" "最让你后悔的不是做错了,是不去做。" "这辆列车已经发车了。不是上不上车的问题,是能不能赶上的问题。" --- 🎙️ 「硅谷观察局」亲友群开放啦! 听了这么多期,是不是有时候想跟我们聊几句? 我们开了一个听友微信群,欢迎你来: 💬 和Nathan、Siky直接交流讨论 🎯 告诉我们下期你想听什么话题 🎬 了解录制背后那些没播出来的趣事和翻车现场 🤝 认识同样关注AI和硅谷动态的朋友们 👉 前200名直接扫码加群(见图片) 我们群里见! --- 🎁 听众福利 想亲手体验 Vibe Coding?Nathan 开设了一堂免费快闪课程——从零开始,用 Cursor + Claude Code 搭建你的第一个AI项目。不需要编程基础,跟着做就行。 👉 免费报名:Agentic Coding Zero-to-Shipped