谷歌Gemini 3.1新模型深夜掀桌:暴击Claude新智元
谷歌深夜再放大招,Gemini 3.1 Flash-Lite正式登场。输出速度363 token/s,价格仅0.25美元/百万Token,跑分却碾压GPT-5 mini和2.5 Flash,堪称最强「穷人版旗舰」。
继Gemini 3.1 Pro屠榜封神之后,谷歌又在深夜扔出一颗炸弹。
刚刚,Gemini 3.1 Flash-Lite正式上线!
速度363 tokens/s,输出价格1.50美元/百万Token,跑分直接碾压GPT-5 mini和Claude 4.5 Haiku。
同一任务下,相较于2.5 Flash(33分钟),3.1 Flash-Lite仅用了4分钟,token消耗最少,且正确率最高。
毫不夸张地说,3.1 Flash-Lite几乎可以做到「瞬时」输出。
上传一份任何PDF、文本、图片、视频、音频,它能极速转成Markdown格式。
又或是,3.1 Flash-Lite「粒子锻造器」,迅速出模拟不同的动态效果,堪称惊艳。
目前,开发者已经可以通过Google AI Studio的Gemini API体验预览版,企业用户可通过Vertex AI接入。
用1/4的价格,跑出5倍的速度
先看最直观的数字。
3.1 Flash-Lite的输出速度达到363 tokens/s,跟自家2.5 Flash-Lite(366 tokens/s)几乎持平,但把上一代Gemini 2.5 Flash(249 tokens/s)远远甩在了身后。
而那些「贵族选手」呢?
GPT-5 mini只有71 tokens/s,Claude 4.5 Haiku也不过108 tokens/s,Grok 4.1 Fast稍好一些,145 tokens/s。
换句话说,Flash-Lite的速度是GPT-5 mini的5倍,是Claude 4.5 Haiku的3.4倍,价格却只有后者的四分之一。
再看具体定价。
3.1 Flash-Lite输入0.25美元/百万Token、输出1.50美元/百万Token。
3.1 Flash-Lite比3.1 Pro便宜8倍


