OpenAI深夜祭出GPT-5.4,暴击Claude新智元
OpenAI深夜突袭,GPT-5.4新王炸场!一夜之间,直接粉碎了Gemini 3.1 Pro和Claude Opus 4.6的神话。这也是头一次,ChatGPT拥有真正「原生电脑使用」能力,办公效率直接拉满。而真正恐怖的地方在于,每一个维度上它都没有短板。
被Gemini和Claude连续压了一个月后,OpenAI终于动手了。
就在刚刚,下一代旗舰GPT-5.4正式发布!
ChatGPT端:GPT-5.4 Thinking与GPT-5.4 Pro全面上线
开发者端:GPT-5.4接入API与Codex,并附带极速版GPT-5.4 fast
之所以直接跳到5.4,是因为这是一次「推理+编程」的合流式跨越
成绩单,直接炸裂。
GDPval胜率83%,叫板顶尖人类专家;
SWE-Bench Pro编程第一,FrontierMath数学第一;
ARC-AGI-2抽象推理跑出83.3%新高,Gemini 3.1 Pro的77.1%、Opus 4.6的68.8%,全部踩在脚下。
OpenAI这次,是真的翻身了。
更炸的是,GPT-5.4还是首个拥有「原生电脑使用」能力的通用模型。
识别UI、操控键鼠、在软件和网页间穿梭自如,像人一样操作电脑。
在OSWorld-Verified上,它直接拿下75%成功率,刷爆SOTA。
上一代GPT-5.2(47.3%),人类(72.4%),一个月前刚登顶的Opus 4.6(72.7%),通通都被超了。
没错,AI操作电脑,已经比人类更熟练了。
能力融合上,GPT-5.4继承了GPT-5.3-Codex的全部编程基因,并且新增了100万token上下文和原生工具搜索,一个模型打通推理、编程、操控全链路。
GPT-5.4 Thinking在思考时,你还能随时介入调整方向,不打断思路,一次对话直接交付结果。
看来,OpenClaw之父加入后,立马让ChatGPT原生「电脑操控」能力变强了!
定价方面,GPT-5.4再创新高,输入价格2.5美元/百万token,输出价格15美元/百万token。
Pro版本就更夸张了,输入30美元/百万token,输出180美元/百万token。
首个全能「计算机使用」通用模型
先说最炸的部分。
GPT-5.4是OpenAI首个具备原生计算机使用能力的通用模型。


