GPT-5.2性能爆表，但红色警报没有解除直面AI

这是OpenAI成立以来，首次发布红色警报（Code Red）后的第一款产品。

虽然在时间上，GPT-5.2只跟5.1相隔了一个月。但是从公布的性能数据来看，GPT-5.2较上一代提升巨大，而且远超谷歌和Anthropic的同期产品。

然而OpenAI的红色警报并未因此解除，这家公司仍处于危机之中。

究其原因，现在的市场已经逐渐开始对OpenAI祛魅，而是更冷静地审视每一分算力背后的投入产出比。在这种前所未有的环境之下，OpenAI不仅需要证明自己是最强的，还需要证明自己不可被替代。

首先要说的，就是GPT-5.2的数学能力。

长期以来，业界普遍认为大语言模型虽然能写代码、能聊天，但在严格的数学推理上总是差强人意。这次GPT-5.2 Thinking在AIME 2025数学竞赛中拿到了100%的满分。

AIME是美国数学邀请赛，题目难度远超普通高中数学，需要扎实的数学功底和灵活的解题思路。GPT-5.2能在这样的测试中全部答对，说明它在数学推理上已经达到了相当高的水平。