OpenAI深夜祭出GPT-5.4,暴击Claude新智元

3/6/2026

OpenAI深夜突袭,GPT-5.4新王炸场!一夜之间,直接粉碎了Gemini 3.1 Pro和Claude Opus 4.6的神话。这也是头一次,ChatGPT拥有真正「原生电脑使用」能力,办公效率直接拉满。而真正恐怖的地方在于,每一个维度上它都没有短板。

被Gemini和Claude连续压了一个月后,OpenAI终于动手了。

就在刚刚,下一代旗舰GPT-5.4正式发布!

ChatGPT端:GPT-5.4 Thinking与GPT-5.4 Pro全面上线

开发者端:GPT-5.4接入API与Codex,并附带极速版GPT-5.4 fast

之所以直接跳到5.4,是因为这是一次「推理+编程」的合流式跨越

成绩单,直接炸裂。

GDPval胜率83%,叫板顶尖人类专家;

SWE-Bench Pro编程第一,FrontierMath数学第一;

ARC-AGI-2抽象推理跑出83.3%新高,Gemini 3.1 Pro的77.1%、Opus 4.6的68.8%,全部踩在脚下。

OpenAI这次,是真的翻身了。

更炸的是,GPT-5.4还是首个拥有「原生电脑使用」能力的通用模型。

识别UI、操控键鼠、在软件和网页间穿梭自如,像人一样操作电脑。

在OSWorld-Verified上,它直接拿下75%成功率,刷爆SOTA。

上一代GPT-5.2(47.3%),人类(72.4%),一个月前刚登顶的Opus 4.6(72.7%),通通都被超了。

没错,AI操作电脑,已经比人类更熟练了。

能力融合上,GPT-5.4继承了GPT-5.3-Codex的全部编程基因,并且新增了100万token上下文和原生工具搜索,一个模型打通推理、编程、操控全链路。

GPT-5.4 Thinking在思考时,你还能随时介入调整方向,不打断思路,一次对话直接交付结果。

看来,OpenClaw之父加入后,立马让ChatGPT原生「电脑操控」能力变强了!

定价方面,GPT-5.4再创新高,输入价格2.5美元/百万token,输出价格15美元/百万token。

Pro版本就更夸张了,输入30美元/百万token,输出180美元/百万token。

首个全能「计算机使用」通用模型

先说最炸的部分。

GPT-5.4是OpenAI首个具备原生计算机使用能力的通用模型。

Scroll for more