10.你天天在用的Gemini Flash模型居然是意外硅谷温差

10.你天天在用的Gemini Flash模型居然是意外

44分钟 ·
播放数14
·
评论数0

本集深度简介

这期Lewis和Will从内部视角拆Google大模型这几年的产品与工程博弈。开篇直击Flash 3.5这次三倍涨价:Flash当年根本不在产品线规划里,是Pro升级速度掉到两三倍、time to first token撑不住聊天机器人客户三秒drop 30%用户的硬指标,才在一个月内紧急训练出来的"意外惊喜"。

  • 慢一点换更高智能是不是好trade off?

  • Google为什么先发Flash,而不是Pro?

我们聊到token定价的玄学:成本算得清,但定价全靠先到市场的定价权,Google和Anthropic早期只能跟着 OpenAI;以及从去年12月Opus拿到编程这个break out use case后,整个行业从打价格战转向每次发布都涨价的拐点。

后半段我们聊到Gemini在ChatGPT上线前两个月、从七人小组到百人团队,为什么DocAI数据如何反哺Gemini的文档理解能力,还有PM与工程师在Flash-lite免费策略上的真实对抗。

时间线索引

00:00 开场 + 听众参与的新尝试 

00:45 Flash三倍涨价

04:29 产品思维vs工程师思维

14:54 token定价玄学

21:44 谷歌为什么迭代慢

26:16 下一个跃进

32:02 Gemini诞生史

40:40 上周趣闻

我们聊到的话题