谷歌Gemini 3.1新模型深夜掀桌：暴击Claude新智元

谷歌深夜再放大招，Gemini 3.1 Flash-Lite正式登场。输出速度363 token/s，价格仅0.25美元/百万Token，跑分却碾压GPT-5 mini和2.5 Flash，堪称最强「穷人版旗舰」。

继Gemini 3.1 Pro屠榜封神之后，谷歌又在深夜扔出一颗炸弹。

刚刚，Gemini 3.1 Flash-Lite正式上线！

速度363 tokens/s，输出价格1.50美元/百万Token，跑分直接碾压GPT-5 mini和Claude 4.5 Haiku。

同一任务下，相较于2.5 Flash（33分钟），3.1 Flash-Lite仅用了4分钟，token消耗最少，且正确率最高。

毫不夸张地说，3.1 Flash-Lite几乎可以做到「瞬时」输出。

上传一份任何PDF、文本、图片、视频、音频，它能极速转成Markdown格式。

又或是，3.1 Flash-Lite「粒子锻造器」，迅速出模拟不同的动态效果，堪称惊艳。

目前，开发者已经可以通过Google AI Studio的Gemini API体验预览版，企业用户可通过Vertex AI接入。

用1/4的价格，跑出5倍的速度

先看最直观的数字。

3.1 Flash-Lite的输出速度达到363 tokens/s，跟自家2.5 Flash-Lite（366 tokens/s）几乎持平，但把上一代Gemini 2.5 Flash（249 tokens/s）远远甩在了身后。

而那些「贵族选手」呢？

GPT-5 mini只有71 tokens/s，Claude 4.5 Haiku也不过108 tokens/s，Grok 4.1 Fast稍好一些，145 tokens/s。

换句话说，Flash-Lite的速度是GPT-5 mini的5倍，是Claude 4.5 Haiku的3.4倍，价格却只有后者的四分之一。

再看具体定价。

3.1 Flash-Lite输入0.25美元/百万Token、输出1.50美元/百万Token。

3.1 Flash-Lite比3.1 Pro便宜8倍