谷歌Gemini 3.1 Pro屠榜封神新智元

谷歌DeepMind深夜扔出核弹，下一代Gemini 3.1 Pro正式登场。在公认的最难ARC-AGI-2测试中，它拿下最高分直接看呆硅谷，推理狂飙2倍，直接把Claude 4.6拉下王座。

Gemini 3 Pro之后，谷歌DeepMind终于祭出杀招！

刚刚，下一代旗舰模型Gemini 3.1 Pro深夜炸场，直接刷爆全领域的SOTA，成为AI新王。

Deep Think之后，清华校友姚顺宇也参与了Gemini 3.1 Pro的研发

这一次，Gemini 3.1 Pro实现了大模型推理能力的史诗级飞跃。

在极为严苛的ARC-AGI-2测试中，它一举斩获77.1%的高分，性能飙升至上一代3.0 Pro的两倍有余。

外加接近满分（98%）的ARC-AGI-1，不管是思考拉满的Claude Opus 4.6，还是特调版的GPT-5.2，通通都被踩在了脚下。

从下方的SVG对比测试中，便能直观感受到3.1 Pro与3 Pro之间悬殊的实力代差。

在编程和推理领域，Gemini 3.1 Pro同样一骑绝尘，全面碾压Sonnet 4.6、GPT-5.2。

在AAII综合评测中，3.1 Pro强势登顶，不仅总分领先Claude Opus 4.6足足4分，API调用成本更是不到一半。

今天起，Gemini 3.1 Pro已正式在Gemini和NotebookLM中上线。开发者可通过Google AI Studio、Antigravity以及Android Studio抢先体验。

如今，硅谷的AI战局已然变天，重量级玩家仅剩下谷歌DeepMind和Anthropic「硬碰硬」。

此前曾风头无两的OpenAI，似乎正逐渐失去在这片主战场上的主动权。

Gemini 3.1 Pro深夜突袭

全能SOTA成绩翻倍

作为谷歌迄今为止最强悍的模型，3.1 Pro在3 Pro的基础上实现了全面跨越。

它不仅具备原生的全模态输入能力，更支持高达100万Token的超长上下文。

在业界最为关注的性能对标中，Gemini 3.1 Pro展现出了令人窒息的统治力。