从全网群嘲到让学术界颤抖——OpenAI攻破80年数学悬案CSDN

5/21/2026

2026 年 5 月 20 日,硅谷向全球学术界与产业界扔下了一枚认知核弹:OpenAI 官方正式宣布,其最新一代通用推理大语言模型,成功破译了提出于 1946 年的组合几何巅峰难题——“埃尔德什平面单位距离猜想”。

这一长达 80 年的科学悬案,在未经数学领域专项优化的通用 AI 面前轰然告破。

AI4Science 是个经典的话题,谷歌 AI 一把手 Demis Hassabis 自从因 AlphaFold 拿到诺奖之后,我们经常可以在各种采访听到他对 AI 改变科学研究的憧憬,只是没想到,这一天来的这么快。

不久前,奇点智能研究院院长、CSDN 高级副总裁李建忠才在巴黎举办的 GOSIM Paris 2026 上,与菲尔兹奖得主、组合数学泰斗蒂莫西·高尔斯(Timothy Gowers)展开了一场关于“智能本质”的深度对话。彼时,高尔斯展现出了超越绝大多数同行的前瞻视野,他力排众议,坚定地站在了“AI 必将超越人类数学家”的阵营,并做出了 5 到 10 年内这一历史时刻就会降临的宏大预言。

高尔斯的理性预判是惊人的,而技术演进的烈度甚至比最乐观的预测还要迅猛。随着 OpenAI 的正式发布,高尔斯亲自见证了这一预言在短短数日后便落入了现实。高尔斯很快在 X 上发了一长串推文,开头便是一句对所有同行的忠告:“如果你是一位数学家,在继续阅读之前,你最好先找个座位坐稳。”

这是一位人类顶级科学家在亲眼目睹新纪元开启时,最真实、最充满敬畏的心理图谱记录。

OpenAI 做了什么?

为了讲清楚整个来龙去脉,我选择了一个比较有趣的角度,就是带大家先回顾下 OpenAI 宫斗那档子事。

一直关注 AI 新闻的读者应该都还记得 Kevin Weil 这个老哥。2024 年 6 月,在 OpenAI 经历了一轮高管出走潮后,他作为新一任首席产品官(CPO)强势加盟,成为了奥特曼(Sam Altman)阵营中最具分量的核心产品操盘手之一。当时奥特曼的很多采访都会带他玩,我们也整理了好几篇。

这位 CPO 老哥一向以高调、激进、且极具商业说服力著称,是硅谷出了名的“大喇叭”。在各大科技大会上,他总能把 OpenAI 未来的技术路线图描绘得让人热血沸腾。但也正是这种极度追求戏剧张力的产品经理思维,让他在面对严谨、保守的数学界时,结结实实地撞上了一面铁墙。

2025 年 10 月,正是 AI 行业对 GPT-5 究竟能带来何种代际飞跃而疯狂内卷的关头。为了向外界证明 OpenAI 的通用推理能力已经具备了顶级科学家的原创智能,Kevin Weil 在社交媒体 X(原推特)上高调放话,宣称内部模型已经一口气解决了 10 个此前未解的埃尔德什难题。在外界高呼“AGI 时代已来”的狂热声浪中,这位老哥怎么也没想到,自己强行帮 AI“冒领”学术成果的行为,已经彻底激怒了那群拿着放大镜看世界的数学家。

维护“埃尔德什问题数据库”的数学家托马斯·布鲁姆(Thomas Bloom)几乎在几小时内就甩出了铁证公开挂人:AI 所谓的“神迹”,不过是把前人早就发表、但尚未被互联网好好索引的现有答案,通过庞大的语料库强行“检索重组”了出来,根本没有产生哪怕一行的原创性逻辑证明。

这场被媒体调侃为“OpenAI 丢人的数学翻车(Embarrassing Math)”风波迅速演变成了一场信任危机。在学术界的乱拳围攻下,我们的老朋友,Yann LeCun 和谷歌 DeepMind 首席执行官 Demis Hassabis 也纷纷参团拷打,Kevin Weil 直接网络社会性死亡,最终不得不被迫承认自己误读了研究员的报告,并删除了那条自嗨的炫耀贴。

这场产品经理抢跑宣发导致的巨大公关灾难,不仅让 OpenAI 在 Meta 和 Google DeepMind 等死敌面前颜面扫地,更成为了这位明星高管在 2026 年 4 月黯然离职的致命导火索。

所以,正是背负着走出学术幻觉的耻辱,OpenAI 要颠覆自己拉完了的印象,在此次“单位距离猜想”的攻坚上,他们采取了近乎偏执的严谨与绝密推进策略。

说白了,就是怂了。

驱动这次突破的模型,是一个纯粹的通用大语言模型(General-purpose LLM)。核心研究员诺姆·布朗(Noam Brown)明确证实,该模型基于 OpenAI “o1” 推理架构的自然演进版本,在底层的神经网络中“没有针对此特定问题甚至数学领域本身进行过任何定向优化”。它不是一个外挂了大量几何规则的脚手架系统,而是一个在泛化知识基础上,依靠自身涌现出的因果逻辑能力进行运算的泛化智能体。

关于布朗,其实也相当值得介绍,为了节省篇幅,这里读完本文之后移步此前翻译的另一篇采访,了解这位从研究桌游外交游戏开始一步步突破 AI 推理极限的狠人。

总之,在研发的暗处,OpenAI 内部的研究员李杰(Lijie Chen)首先利用该通用模型,成功构建出了打破人类网格极限的反例;随后,马克·塞尔克(Mark Sellke)与梅塔布·索尼(Mehtaab Sawhney)进行了长达数月的内部逻辑排雷与正确性验证。在听取了数学家维克多·王(Victor Wang)的极度硬核建议后,团队将模型最初使用的“3-阶级域塔”论证,优化简化为了更为清晰的“2-阶级域塔”数论逻辑。

最终,这个通用大脑在对错误“零容忍”的数理拓扑空间中,凭空走完了几万步逻辑钢丝,生成了一份长达 125 页的、完全没有逻辑断裂的连续思维链(Chain-of-Thought, CoT)推导手稿。

为了确保学术上的绝对无瑕,在正式发布前,OpenAI 将这份 125 页的学术手稿以及一份消化后的精简备注,秘密发送给了包括诺加·阿隆(Noga Alon)和蒂莫西·高尔斯在内的 9 位全球最顶尖的独立数学家进行盲审和联合同行评议。

当高尔斯在秘密审查中连续数日翻阅这 125 页严丝合缝、调动了无数高阶定理的思维链后,这位曾摘得数学界最高荣誉的学者被彻底折服。这也直接催生了他在盲审评议后给出的至高背书:“如果这是一个人类数学家把这篇论文投给数学界最高期刊《数学年刊》(Annals of Mathematics),并且我被要求快速给个意见,我会毫不犹豫地建议 ‘直接接收’。在 AI 数学史上,没有任何先前的成就甚至能接近这一高度。”

当模式匹配被推向极致

高尔斯对 OpenAI 成果的高度赞誉,不仅是指 125 页论证在工程层面的零错误,更是指 AI 在解题思路中展现出的、打破人类数十年思维定势的“跨界原创性”。

“平面单位距离问题”的本质极其直观:在一个无限大的二维平面里安排 个点,在严格的空间约束下,如何排列才能让相互之间距离恰好等于 1 米的“点对”数量达到最大化?

在过去的 80 年里,人类最聪明的头脑无一例外地陷入了“最佳实践的诅咒”。从埃尔德什本人在 1946 年的奠基性论文开始,几代数学家都坚信:将点如同国际象棋棋盘一般整齐排列的“正方形网格(Square Grid)”,就是这个宇宙中所能允许的效率极限。因为这种对称性过于直观和优雅,整个学术界都被权威共识洗脑了,默认埃尔德什的猜想不可动摇。

Scroll for more