今夜,谷歌亲手淘汰谷歌:Gemini 3.5来了新智元

5/19/2026

劈柴和Hassabis把半年大招一晚清仓了!Gemini Omni任意输入生成视频,3.5 Flash断层碾压一切,Spark 7×24h云端替你干活。这次,谷歌是要把OpenAI和Anthropic一起给埋了。

谷歌I/O 2026大会,火力全开!

刚刚,劈柴和Demis Hassabis同台登场,把攒了半年的大招一口气全部亮了出来。

没有一丝悬念,今晚最大的主角,Gemini Omni正式亮相!

作为一个真正「全能」的大模型,Omni可以接收任意形式的输入,生成任意内容。

并且首发支持视频输出,堪称「视频版Nano Banana」。

今晚的另一个高潮,属于Gemini 3.5 Flash。

在几乎所有的基准测试中,3.5 Flash都实现了对自家前代旗舰Gemini 3.1 Pro的碾压。

输出速度也直接翻倍,对比GPT-5.5和Opus 4.7更是快了4倍有余。

更强的3.5 Pro,则会在下个月发布。

此外,亮相的还有一大波重磅新品:

· Antigravity 2.0,全新独立桌面应用,从IDE进化为Agent开发平台

· Gemini Spark,个人AI特工,7×24h云端运行

· Gemini App改版,代号Neural Expressive,改为算力计费

· AI Ultra订阅计划新增100美元版本,最高档从250降至200美元

· 谷歌搜索25年最大升级,接入3.5 Flash,新增智能搜索框、自动生成mini应用等

......

毫不夸张地说,这场I/O的干货密度,堪称历年之最。

Gemini Omni首发

一个「全能」AI诞生了

正如预热视频疯狂暗示的那样,万众期待的Gemini Omni终于来了。

Hassabis亲自登台宣布,「我们正迈出下一个重要的一步——Gemini Omni,这是一个可从任何输入创建内容的全新模型」。

这个排面就说明了一切。谷歌这一次要打造的,是一个「全能」的AI创作引擎。

它把Gemini的智能与最强的生成式AI融为一体,在世界理解、多模态和编辑三个维度上,全部拉满。

直白讲,给到图片、音频、视频、文字的任意组合,它就能生成一段高质量视频。而且,可以用聊天的方式编辑视频。

更关键的,Omni不只是「看起来像」,它真的在理解物理世界。

Hassabis的原话是,以前的系统在模拟重力、动能这些概念时经常翻车,但Omni实现了一个「阶跃变化」。

它把Gemini的「世界知识」和「推理能力」注入进了视频生成。

给它一句prompt「用粘土动画解释蛋白质折叠」,生成的视频里氨基酸链折叠成α螺旋和β折叠的每一步都科学准确,视觉上是精致的定格动画。

又比如为英文26个字母匹配对应物体。

C是水豚(Capybara),D是迪斯科球,L是熔岩灯。Omni不是在拼贴素材,它真的在把语言、图像和语义联结在一起。

不得不说,从逼真到有意义,这一步跨得太大了。

在台上,Hassabis掏出一段自拍视频开始现场魔改。手掌上随手画的圈变成了黑洞,傍晚散步的街道变成了赛博朋克场景。

一句话重写画面,一句话改变世界。

任何东西都可以成为创造全新现实的画布。

再比如,自拍掌中玩火,一张纸画了一个圈立即变黑洞,各种脑洞大开玩法都可实现。

Scroll for more