今夜,谷歌亲手淘汰谷歌:Gemini 3.5来了新智元
劈柴和Hassabis把半年大招一晚清仓了!Gemini Omni任意输入生成视频,3.5 Flash断层碾压一切,Spark 7×24h云端替你干活。这次,谷歌是要把OpenAI和Anthropic一起给埋了。
谷歌I/O 2026大会,火力全开!
刚刚,劈柴和Demis Hassabis同台登场,把攒了半年的大招一口气全部亮了出来。
没有一丝悬念,今晚最大的主角,Gemini Omni正式亮相!
作为一个真正「全能」的大模型,Omni可以接收任意形式的输入,生成任意内容。
并且首发支持视频输出,堪称「视频版Nano Banana」。
今晚的另一个高潮,属于Gemini 3.5 Flash。
在几乎所有的基准测试中,3.5 Flash都实现了对自家前代旗舰Gemini 3.1 Pro的碾压。
输出速度也直接翻倍,对比GPT-5.5和Opus 4.7更是快了4倍有余。
更强的3.5 Pro,则会在下个月发布。
此外,亮相的还有一大波重磅新品:
· Antigravity 2.0,全新独立桌面应用,从IDE进化为Agent开发平台
· Gemini Spark,个人AI特工,7×24h云端运行
· Gemini App改版,代号Neural Expressive,改为算力计费
· AI Ultra订阅计划新增100美元版本,最高档从250降至200美元
· 谷歌搜索25年最大升级,接入3.5 Flash,新增智能搜索框、自动生成mini应用等
......
毫不夸张地说,这场I/O的干货密度,堪称历年之最。
Gemini Omni首发
一个「全能」AI诞生了
正如预热视频疯狂暗示的那样,万众期待的Gemini Omni终于来了。
Hassabis亲自登台宣布,「我们正迈出下一个重要的一步——Gemini Omni,这是一个可从任何输入创建内容的全新模型」。
这个排面就说明了一切。谷歌这一次要打造的,是一个「全能」的AI创作引擎。
它把Gemini的智能与最强的生成式AI融为一体,在世界理解、多模态和编辑三个维度上,全部拉满。
直白讲,给到图片、音频、视频、文字的任意组合,它就能生成一段高质量视频。而且,可以用聊天的方式编辑视频。
更关键的,Omni不只是「看起来像」,它真的在理解物理世界。
Hassabis的原话是,以前的系统在模拟重力、动能这些概念时经常翻车,但Omni实现了一个「阶跃变化」。
它把Gemini的「世界知识」和「推理能力」注入进了视频生成。
给它一句prompt「用粘土动画解释蛋白质折叠」,生成的视频里氨基酸链折叠成α螺旋和β折叠的每一步都科学准确,视觉上是精致的定格动画。
又比如为英文26个字母匹配对应物体。
C是水豚(Capybara),D是迪斯科球,L是熔岩灯。Omni不是在拼贴素材,它真的在把语言、图像和语义联结在一起。
不得不说,从逼真到有意义,这一步跨得太大了。
在台上,Hassabis掏出一段自拍视频开始现场魔改。手掌上随手画的圈变成了黑洞,傍晚散步的街道变成了赛博朋克场景。
一句话重写画面,一句话改变世界。
任何东西都可以成为创造全新现实的画布。
再比如,自拍掌中玩火,一张纸画了一个圈立即变黑洞,各种脑洞大开玩法都可实现。


