本集深度简介
这期Lewis和Will从内部视角拆Google大模型这几年的产品与工程博弈。开篇直击Flash 3.5这次三倍涨价:Flash当年根本不在产品线规划里,是Pro升级速度掉到两三倍、time to first token撑不住聊天机器人客户三秒drop 30%用户的硬指标,才在一个月内紧急训练出来的"意外惊喜"。
慢一点换更高智能是不是好trade off?
Google为什么先发Flash,而不是Pro?
我们聊到token定价的玄学:成本算得清,但定价全靠先到市场的定价权,Google和Anthropic早期只能跟着 OpenAI;以及从去年12月Opus拿到编程这个break out use case后,整个行业从打价格战转向每次发布都涨价的拐点。
后半段我们聊到Gemini在ChatGPT上线前两个月、从七人小组到百人团队,为什么DocAI数据如何反哺Gemini的文档理解能力,还有PM与工程师在Flash-lite免费策略上的真实对抗。
时间线索引
开场 + 听众参与的新尝试
Flash三倍涨价
产品思维vs工程师思维
token定价玄学
谷歌为什么迭代慢
下一个跃进
Gemini诞生史
上周趣闻
我们聊到的话题
Meta发布250亿美元企业债券全(www.reuters.com)
Gemini Diffusion (deepmind.google)
OpenRouter的模型排行(openrouter.ai)

