10.你天天在用的Gemini Flash模型居然是意外

本集深度简介

这期Lewis和Will从内部视角拆Google大模型这几年的产品与工程博弈。开篇直击Flash 3.5这次三倍涨价：Flash当年根本不在产品线规划里，是Pro升级速度掉到两三倍、time to first token撑不住聊天机器人客户三秒drop 30%用户的硬指标，才在一个月内紧急训练出来的"意外惊喜"。

慢一点换更高智能是不是好trade off？
Google为什么先发Flash，而不是Pro？

我们聊到token定价的玄学：成本算得清，但定价全靠先到市场的定价权，Google和Anthropic早期只能跟着 OpenAI；以及从去年12月Opus拿到编程这个break out use case后，整个行业从打价格战转向每次发布都涨价的拐点。

后半段我们聊到Gemini在ChatGPT上线前两个月、从七人小组到百人团队，为什么DocAI数据如何反哺Gemini的文档理解能力，还有PM与工程师在Flash-lite免费策略上的真实对抗。

时间线索引

00:00 开场 + 听众参与的新尝试

00:45 Flash三倍涨价

04:29 产品思维vs工程师思维

14:54 token定价玄学

21:44 谷歌为什么迭代慢

26:16 下一个跃进

32:02 Gemini诞生史

40:40 上周趣闻

我们聊到的话题

Meta发布250亿美元企业债券全(www.reuters.com)
Gemini Diffusion (deepmind.google)
OpenRouter的模型排行(openrouter.ai)