Gemini 2.0 加持,谷歌 “贾维斯” 即将降临AI日报精选播客

Gemini 2.0 加持,谷歌 “贾维斯” 即将降临

2分钟 ·
播放数3
·
评论数0

大家好,我是今天的播客主播。今天要和大家聊聊一个超级令人兴奋的话题 —— 谷歌版贾维斯。

你们知道吗?科幻作品里的智能助手贾维斯似乎就要在现实中出现啦。据消息称,谷歌正在开发一个类似的项目,叫 Project Jarvis,预计在今年 12 月就会亮相哦。它可是由强大的 Gemini 2.0 加持的呢。

这个 Project Jarvis 到底有多厉害呢?它能够自动操控 Chrome 浏览器完成各种网页任务。就像我们平时在网上收集研究信息、购物或者预定航班这些事情,它都可以帮我们搞定。它的工作原理和之前 Anthropic 展示的 Claude 3.5 有点类似,会截屏、解析屏幕内容,然后自动点击按钮或者输入文本。不过它在执行操作的时候会有几秒钟的思考时间,所以目前还只能在云上操作。

其实在 AI 自主操控电脑这个领域,很多科技大厂都在发力。比如微软开源了 OmniParser,它可以解析屏幕,帮助 AI 理解用户意图,从而完成一些复杂任务。OpenAI 内部也有了可以操控计算机完成在线订餐、解决编程难题等任务的 AI 智能体雏形。苹果也预计在明年发布具有跨多个 APP 屏幕识别能力的产品。

我真的特别期待谷歌版贾维斯的问世。它可能会给我们的生活和工作带来巨大的改变。想象一下,以后我们可以更轻松地完成各种网上操作,节省很多时间和精力。让我们一起关注这个项目的进展,看看未来的智能助手到底能给我们带来多少惊喜吧。