GPT-5.5 Pro两小时跑出博士级证明新智元
全网震撼!菲尔兹奖得主把未解数学题扔给GPT-5.5 Pro,不到两小时拿到博士论文级证明。整个过程中,他没给出任何数学思路。
今天,菲尔兹奖得主Timothy Gowers在个人博客上发了一篇长文——
最近一次使用ChatGPT 5.5 Pro的体验
标题平平无奇,内容却让整个数学圈坐不住了。
文中,他亲手验证了一个令整个数学界不寒而栗的事实:
GPT-5.5 Pro,用了不到两个小时,独立完成了一项博士论文级别的数学研究。
而Gowers本人在整个过程中,数学贡献几乎为0。
两个小时,一章博士论文级成果。
全程2小时,菲尔兹奖得主贡献为0
事情是这样的。
这几天,Timothy Gowers拿到了ChatGPT 5.5 Pro的测试权限,决定搞一次真刀真枪的测试。
他从数学家Melvyn Nathanson的一篇新论文中,挑出了几个关于加法数论中集合求和的未解问题。
这些问题的核心是:给定一个k个整数的集合A,它的h重求和集hA的可能大小有哪些?
要实现特定大小的求和集,集合的「直径」最小能是多少?
Nathanson自己给出了一个指数级的上界:2^k - 1。
于是,Gowers把问题扔给了GPT-5.5 Pro。17分钟05秒后,AI给出了一个构造,直接把上界从指数级干到了二次方级。
而这,显然已经是最优的了。
更让人坐不住的,是Gowers在整个过程中扮演的角色。
他没有给出任何数学思路,没有提供关键引理,更没有指出证明方向,Gowers只是充当了一个「情绪价值提供者」和「排版助手」,给出的提示词极其简单——
对,这个想法不错,试试看能不能成;
把这段推导写成标准的LaTeX论文格式。
博客中,Gowers在反复强调:提示词「不包含任何数学输入」。
AI走的每一步推理、每一个构造、每一处关键转折,都是它自己想出来的。
仅用了几个小时,AI就完成了人类可能需要数月,甚至数年才能完成的工作。
换句话说,人类顶级数学家在这场合作中的智力贡献,约等于0。
AI给出原创想法,震惊MIT博士生
如果故事到这里就结束了,那顶多算是「AI又解了一道数学题」。
但后面发生的事情,才真正让人细思极恐。
Gowers继续追问ChatGPT:那一般情况的h呢?这个问题的难度陡然上升。
因为当h=2的时候,数学家们已完全搞清了所有可能的求和集大小。但对于一般的h,甚至不知道完整的答案是什么。
此前,MIT博士生Isaac Rajagopal已经证明了一个指数级的上界。
Gowers于是让GPT去看看能不能改进拉Rajagopal的结果。
第一轮:GPT思考了16分41秒,把上界从k的指数级改进到了k^(1/2+ε)的指数级。
这是对拉Rajagopal工作的「常规修改」。
第二轮:Gowers说,能不能再进一步,搞到多项式级?
GPT思考了13分33秒,表示「有戏」,但需要验证两个技术性命题。
Gowers让它自己验证,9分12秒后,GPT完成了验证,并在随后的31分40秒内写出了完整的预印本论文。
论文地址:https://drive.google.com/file/d/1IkJBcWYz_3J_QGsESBmMa-jrEHAJDcJB/view
最终结果:N(h,k) ≤ O(k^{10h³})——从指数级,直接跃升到多项式级。
Rajagopal本人看完后,给出了一个让人五味杂陈的评价:
ChatGPT这个想法很原创、很巧妙。如果是我自己想出来的,我会非常骄傲。
然而,我需要一两周才能完成的脑力风暴,GPT只用了不到一个小时。


