从爆亏千亿到史诗翻身——Gemini的逆袭之路AI-前沿

从爆亏千亿到史诗翻身——Gemini的逆袭之路

9分钟 ·
播放数0
·
评论数0

一、本期核心人物

  • 德米斯·哈萨比斯:被称作“AI界奥本海默”,天赋型研究者,DeepMind创始人,Google DeepMind CEO,是Gemini逆袭的核心主导者。
  • 杰夫·迪恩:谷歌元老,原Google Brain掌舵人,后辞去管理职位转任首席科学家,回归技术研发。
  • 拉里·佩奇、谢尔盖·布林:谷歌创始人,在谷歌AI危机时被请回,助力内部重组。
  • 诺姆·沙泽尔:Transformer署名作者,被哈萨比斯以27亿美金请回,重新设计Gemini核心注意力机制。

二、关键时间线

  1. 2010年:哈萨比斯在伦敦创立DeepMind,使命是“先解决智能本身,再用它去解决其他一切问题”。
  2. 2013年:DeepMind的AI无预设规则自学雅达利《打砖块》并实现自动连击,被谷歌创始人拉里·佩奇看中。
  3. 2014年:谷歌以6.5亿美金收购DeepMind,哈萨比斯为DeepMind争取到伦敦总部、独立伦理委员会等主权独立条件。
  4. 2014-2023年(9年):DeepMind与Google Brain形成对立,陷入长期内耗。
  5. 2022年11月:ChatGPT发布,两个月用户破亿,直接威胁谷歌搜索广告帝国。
  6. 2023年2月:谷歌仓促推出Bard迎战GPT,宣传片中答错詹姆斯·韦伯望远镜基础问题,市值一夜蒸发1000亿美元。
  7. 2023年4月20日:Google Brain与DeepMind正式合并为Google DeepMind,哈萨比斯出任CEO,原Bard更名为Gemini。
  8. 后续:Gemini凭借核心技术突破,实现对GPT的技术碾压,成为谷歌AI核心及苹果AI底座。

三、核心内容拆解

1. 哈萨比斯的初心与DeepMind的诞生

哈萨比斯是天赋型选手,4岁学棋两周出师;12岁国际象棋比赛失利后,萌生“人类脑力不应被无意义消耗”的想法。2010年创立DeepMind后,2013年凭借AI自学《打砖块》的成果获得谷歌关注,2014年接受谷歌收购,核心诉求是借助谷歌的海量AI训练数据,推进自身AI研究。

2. 谷歌内部9年内斗:两大AI团队的对立

谷歌原本想让DeepMind(哈萨比斯主导)与Google Brain(杰夫·迪恩主导)“赛马”,却引发严重内耗,核心矛盾集中在三点:

  • 技术层面:双方各建代码库,参数互不互通,重复实验造成资金浪费;
  • 算力层面:Google Brain掌控TPU芯片集群,DeepMind使用算力需层层申请,限制研发进度;
  • 理念层面:DeepMind侧重AGI(通用人工智能)研究,认为Google Brain过于实用主义;Google Brain则认为DeepMind的研究对公司财报无实质贡献。

即便AlphaGo 4:1击败李世石让哈萨比斯声名大噪,Google Brain推出Transformer架构,双方依旧势均力敌,哈萨比斯始终没有产品发布、算力调配的实权。

3. 危机爆发:ChatGPT来袭与Bard的致命翻车

2022年11月ChatGPT的发布,打破了谷歌在AI领域的优势,其两个月破亿的用户增长,直接威胁谷歌核心的搜索广告业务,谷歌拉响红色警报。

为应对危机,谷歌在2023年2月仓促推出Bard迎战GPT,但在官方宣传片中,Bard答错了詹姆斯·韦伯望远镜的基础问题,引发舆论猛烈抨击,发布会结束后,谷歌市值一夜蒸发1000亿美元。

与此同时,OpenAI持续快速迭代,微软追加100亿美元投资,谷歌AI落后成为行业公认事实,其内部长期的技术内耗也被推到风口浪尖。

4. 破局关键:谷歌的内部整合与权力重构

为扭转颓势,谷歌启动关乎未来十年的架构重组,四大举措实现破局:

  • 创始人回归:CEO皮查伊请回隐退的拉里·佩奇和谢尔盖·布林,其中布林亲自参与工程开发,凝聚公司团队士气;
  • 团队合并:2023年4月20日,Google Brain与DeepMind正式合并为Google DeepMind,哈萨比斯出任CEO,原Bard更名为Gemini(双子星),寓意两大团队彻底融合;
  • 利益平衡:哈萨比斯获得谷歌AI资源的终极调配权,杰夫·迪恩辞去管理职位,转任首席科学家,专注技术研发,化解内部矛盾;
  • 重金揽才:哈萨比斯以27亿美金请回被谷歌赶走的Transformer署名作者诺姆·沙泽尔,其重新设计的Gemini核心注意力机制,让模型在低算力下实现比GPT更快更准的表现。

5. Gemini的三大核心技术命脉:实现技术碾压

哈萨比斯为Gemini定下三大核心技术,成为其击败GPT的关键,也是逆袭的核心支撑:

  • 树搜索强化学习:沿用AlphaGo的核心打法,AI会先构思多个答案版本,筛选逻辑最通顺、无漏洞的答案输出,在数学、编程等逻辑型任务上表现远超GPT;
  • 原生多模型:区别于行业内“先学文字,再学视听”的传统模式,Gemini从研发初期就基于YouTube视频、谷歌图片、网页文本等混合数据训练,可实现看图、听声、读字的无缝切换,跨界能力领先行业;
  • 自研TPU芯片:算力是AI研发的核心支撑,谷歌从2015年起自主研发AI芯片,Gemini落地时已用上第五代TPU,实现模型与算力的自主掌控;而OpenAI的算力仍依赖英伟达,存在供应与技术双重限制。

6. 逆袭成果

凭借内部的彻底整合的核心技术的精准突破,Gemini实现了对GPT的史诗级碾压,不仅成为谷歌自身的AI核心,更成功成为苹果AI的底座,帮助谷歌从AI赛道的落后者,重新夺回行业王座,完成了从爆亏千亿到史诗翻身的逆袭。

四、本期关键亮点

  • 谷歌AI的低谷:2023年因Bard翻车,市值一夜蒸发1000亿美元,陷入内耗与外部竞争的双重危机;
  • 逆袭的核心:并非单纯的技术突破,而是内部团队整合、权力重构+精准的技术布局双重作用的结果;
  • Gemini的核心优势:三大核心技术形成壁垒,尤其在逻辑任务、跨界能力、算力自主上领先GPT;
  • 关键人物的作用:哈萨比斯的战略主导、诺姆·沙泽尔的技术支撑,以及创始人回归的助力,缺一不可。

五、相关关键词

Gemini、谷歌、DeepMind、哈萨比斯、Google Brain、AI逆袭、GPT、Bard、TPU芯片、Transformer、AGI