Gemma 4深夜突降,31B爆杀20倍巨头新智元

4/4/2026

谷歌深夜掏家底!Gemma 4全系开源,仅用31B越级斩杀20倍体量巨头。数学能力暴涨68%,硬生生把前代打成计量单位,开源界迎来终极大洗牌!

谷歌这次,把家底都掏了。

凌晨,谷歌DeepMind正式发布Gemma 4,一口气放出四款开源模型。

从能塞进手机的2B,到可以单卡跑满的31B,四个尺寸全覆盖,全部基于Gemini 3同源打造。

时隔一年,Gemma 4终于来了,实力迎来史诗级跃迁。

最炸的一个数字,31B Dense在Arena AI文本榜单上拿下开源第三,Elo评分1452。

排在它前面的,一个600多亿参数,一个超过1000亿。Gemma 4用31B的体量,硬生生挤进了这个量级的牌桌。

26B MoE更离谱:260亿参数,推理时只激活38亿,Elo打到1441,排开源第六。

看一眼成绩单,Gemma 4几乎没有弱点,简直就是对上一代的「血脉压制」——

数学(AIME 2026):89.2% vs 21.2%,暴力拉升68个百分点;

编程(LiveCodeBench):80% vs 29.1%,实力堪称代际断层;

智能体(t2-bench):Gemma 4狂揽86.4%,Gemma 3仅有6.6%,差距大到「没眼看」。

另外,在多语言推理、知识问答的基准测试中,Gemma 4均实现了40%性能飙升。

令全网背脊发凉的是,一个31B Gemma 4,越级斩杀体量是其20倍的模型。

一台Mac mimi即可跑Gemma 4,还有人手机已经用上了。

Hugging Face CEO Clément Delangue的评价只有一句话,「这是一个巨大的里程碑。」

四款模型,从口袋到工作站全覆盖

先看Gemma 4「全家桶」具体成员——

每个尺寸都提供base和instruction-tuned两个版本。

E2B和E4B负责端侧,跟谷歌Pixel团队、高通、联发科联合优化,能在手机、树莓派、Jetson Orin Nano上离线运行,延迟接近零。

Scroll for more