摘要: 谷歌周四重磅发布基于 Gemini 3 Pro 的“深度研究智能体(Deep Research)”及全新的 Interactions API,旨在通过 AI 代理接管人类的复杂搜索任务。然而,戏剧性的一幕发生了:就在同一天,OpenAI 祭出了代号为“大蒜(Garlic)”的 GPT-5.2,瞬间让谷歌刚刚发布的跑分数据变成了“过去式”。
硅谷的 AI 军备竞赛在周四上演了一场火星撞地球般的精彩对决。
谷歌正式发布了重构版的 Gemini Deep Research 智能体,其核心驱动力来自谷歌备受吹捧的最先进基础模型 Gemini 3 Pro。这不仅仅是一个能写报告的工具,更是谷歌试图将“搜索”进化为“研究”的战略级产品。
🕵️♂️ 从“搜索”到“深度研究”
这款新的 Deep Research 智能体被设计用来处理海量信息和超长上下文。谷歌表示,客户已经开始利用它处理从商业尽职调查到药物毒性安全研究等各类复杂任务。
为了证明其能力,谷歌甚至不得不“造”了一个新词——DeepSearchQA。这是一个全新的基准测试,专门用来考验 AI 在复杂、多步骤信息搜寻任务中的表现。此外,谷歌还在名为“人类最后的考试(Humanity’s Last Exam)”和 BrowserComp 等基准上进行了测试。
结果不出所料,谷歌的新智能体在这些测试中击败了竞争对手。它特别强调了 Gemini 3 Pro 作为“最符合事实”模型的地位,旨在最大限度地减少幻觉——这对于需要长时间自主运行的 AI 代理来说至关重要。
🛠️ Interactions API:把 AI 塞进你的 App
除了产品本身,谷歌还向开发者递出了一把新武器:Interactions API。
这不仅仅是一个接口,它是谷歌为即将到来的“代理 AI(Agentic AI)”时代准备的基础设施。通过这个 API,开发者可以将谷歌 SOTA(State-of-the-Art)级别的研究能力直接嵌入到自己的应用程序中。
谷歌还透露,这款深度研究智能体很快将整合进谷歌搜索、Google Finance、Gemini App 以及大受欢迎的 NotebookLM 中。这标志着谷歌正在加速推进一个**“人类不再亲自搜索,而是派 AI 代理去搜索”**的新世界。
🧄 尴尬的撞车:OpenAI “大蒜” 压境
然而,科技圈的残酷在于,你的“遥遥领先”可能只能维持几个小时。
就在谷歌发布这些令人印象深刻的基准测试数据的同一天,OpenAI 突然发布了备受期待的 GPT-5.2,代号 “大蒜(Garlic)”。
OpenAI 宣称,这款代号“大蒜”的新模型在一系列典型基准测试中全面超越了竞争对手——尤其是谷歌。这意味着,谷歌刚刚在新闻稿里吹嘘的“战胜 ChatGPT 5 Pro”的成绩单,在发布的瞬间可能就已经过时了。
这种“针尖对麦芒”的发布时机显然不是巧合。OpenAI 选择在此时亮剑,无疑是为了在谷歌试图抢占“深度研究”话语权的关键时刻,通过更高维度的模型能力进行降维打击。
🔭 搜索下一步
从“即时答案”到“异步研究”
谷歌与 OpenAI 的这次交锋,揭示了搜索领域正在发生的质变。
过去的搜索是同步的:你提问,搜索引擎(或 AI)立刻给你一个答案。
而搜索的下一步,是异步的深度研究。
Gemini Deep Research 的出现意味着,未来的“搜索”可能是一个耗时几分钟甚至几小时的过程。你不再是问“苹果股价是多少”,而是对你的 AI 代理说:“帮我分析苹果未来五年的供应链风险”,然后你去喝杯咖啡,回来时 AI 已经替你阅读了上千页的财报和新闻,并写好了一份深度研报。
在这个新战场上,谁能让 AI 拥有更强的 “长时间推理能力” 和 “抗幻觉能力”,谁就能定义下一代互联网的入口。
