谷歌Gemini 3.1 Pro屠榜封神新智元
谷歌DeepMind深夜扔出核弹,下一代Gemini 3.1 Pro正式登场。在公认的最难ARC-AGI-2测试中,它拿下最高分直接看呆硅谷,推理狂飙2倍,直接把Claude 4.6拉下王座。
Gemini 3 Pro之后,谷歌DeepMind终于祭出杀招!
刚刚,下一代旗舰模型Gemini 3.1 Pro深夜炸场,直接刷爆全领域的SOTA,成为AI新王。
Deep Think之后,清华校友姚顺宇也参与了Gemini 3.1 Pro的研发
这一次,Gemini 3.1 Pro实现了大模型推理能力的史诗级飞跃。
在极为严苛的ARC-AGI-2测试中,它一举斩获77.1%的高分,性能飙升至上一代3.0 Pro的两倍有余。
外加接近满分(98%)的ARC-AGI-1,不管是思考拉满的Claude Opus 4.6,还是特调版的GPT-5.2,通通都被踩在了脚下。
从下方的SVG对比测试中,便能直观感受到3.1 Pro与3 Pro之间悬殊的实力代差。
在编程和推理领域,Gemini 3.1 Pro同样一骑绝尘,全面碾压Sonnet 4.6、GPT-5.2。
在AAII综合评测中,3.1 Pro强势登顶,不仅总分领先Claude Opus 4.6足足4分,API调用成本更是不到一半。
今天起,Gemini 3.1 Pro已正式在Gemini和NotebookLM中上线。开发者可通过Google AI Studio、Antigravity以及Android Studio抢先体验。
如今,硅谷的AI战局已然变天,重量级玩家仅剩下谷歌DeepMind和Anthropic「硬碰硬」。
此前曾风头无两的OpenAI,似乎正逐渐失去在这片主战场上的主动权。
Gemini 3.1 Pro深夜突袭
全能SOTA成绩翻倍
作为谷歌迄今为止最强悍的模型,3.1 Pro在3 Pro的基础上实现了全面跨越。
它不仅具备原生的全模态输入能力,更支持高达100万Token的超长上下文。
在业界最为关注的性能对标中,Gemini 3.1 Pro展现出了令人窒息的统治力。


