从全网群嘲到让学术界颤抖——OpenAI攻破80年数学悬案CSDN

2026 年 5 月 20 日，硅谷向全球学术界与产业界扔下了一枚认知核弹：OpenAI 官方正式宣布，其最新一代通用推理大语言模型，成功破译了提出于 1946 年的组合几何巅峰难题——“埃尔德什平面单位距离猜想”。

这一长达 80 年的科学悬案，在未经数学领域专项优化的通用 AI 面前轰然告破。

AI4Science 是个经典的话题，谷歌 AI 一把手 Demis Hassabis 自从因 AlphaFold 拿到诺奖之后，我们经常可以在各种采访听到他对 AI 改变科学研究的憧憬，只是没想到，这一天来的这么快。

不久前，奇点智能研究院院长、CSDN 高级副总裁李建忠才在巴黎举办的 GOSIM Paris 2026 上，与菲尔兹奖得主、组合数学泰斗蒂莫西·高尔斯（Timothy Gowers）展开了一场关于“智能本质”的深度对话。彼时，高尔斯展现出了超越绝大多数同行的前瞻视野，他力排众议，坚定地站在了“AI 必将超越人类数学家”的阵营，并做出了 5 到 10 年内这一历史时刻就会降临的宏大预言。

高尔斯的理性预判是惊人的，而技术演进的烈度甚至比最乐观的预测还要迅猛。随着 OpenAI 的正式发布，高尔斯亲自见证了这一预言在短短数日后便落入了现实。高尔斯很快在 X 上发了一长串推文，开头便是一句对所有同行的忠告：“如果你是一位数学家，在继续阅读之前，你最好先找个座位坐稳。”

这是一位人类顶级科学家在亲眼目睹新纪元开启时，最真实、最充满敬畏的心理图谱记录。

OpenAI 做了什么？

为了讲清楚整个来龙去脉，我选择了一个比较有趣的角度，就是带大家先回顾下 OpenAI 宫斗那档子事。

一直关注 AI 新闻的读者应该都还记得 Kevin Weil 这个老哥。2024 年 6 月，在 OpenAI 经历了一轮高管出走潮后，他作为新一任首席产品官（CPO）强势加盟，成为了奥特曼（Sam Altman）阵营中最具分量的核心产品操盘手之一。当时奥特曼的很多采访都会带他玩，我们也整理了好几篇。

这位 CPO 老哥一向以高调、激进、且极具商业说服力著称，是硅谷出了名的“大喇叭”。在各大科技大会上，他总能把 OpenAI 未来的技术路线图描绘得让人热血沸腾。但也正是这种极度追求戏剧张力的产品经理思维，让他在面对严谨、保守的数学界时，结结实实地撞上了一面铁墙。

2025 年 10 月，正是 AI 行业对 GPT-5 究竟能带来何种代际飞跃而疯狂内卷的关头。为了向外界证明 OpenAI 的通用推理能力已经具备了顶级科学家的原创智能，Kevin Weil 在社交媒体 X（原推特）上高调放话，宣称内部模型已经一口气解决了 10 个此前未解的埃尔德什难题。在外界高呼“AGI 时代已来”的狂热声浪中，这位老哥怎么也没想到，自己强行帮 AI“冒领”学术成果的行为，已经彻底激怒了那群拿着放大镜看世界的数学家。

维护“埃尔德什问题数据库”的数学家托马斯·布鲁姆（Thomas Bloom）几乎在几小时内就甩出了铁证公开挂人：AI 所谓的“神迹”，不过是把前人早就发表、但尚未被互联网好好索引的现有答案，通过庞大的语料库强行“检索重组”了出来，根本没有产生哪怕一行的原创性逻辑证明。

这场被媒体调侃为“OpenAI 丢人的数学翻车（Embarrassing Math）”风波迅速演变成了一场信任危机。在学术界的乱拳围攻下，我们的老朋友，Yann LeCun 和谷歌 DeepMind 首席执行官 Demis Hassabis 也纷纷参团拷打，Kevin Weil 直接网络社会性死亡，最终不得不被迫承认自己误读了研究员的报告，并删除了那条自嗨的炫耀贴。

这场产品经理抢跑宣发导致的巨大公关灾难，不仅让 OpenAI 在 Meta 和 Google DeepMind 等死敌面前颜面扫地，更成为了这位明星高管在 2026 年 4 月黯然离职的致命导火索。

所以，正是背负着走出学术幻觉的耻辱，OpenAI 要颠覆自己拉完了的印象，在此次“单位距离猜想”的攻坚上，他们采取了近乎偏执的严谨与绝密推进策略。

说白了，就是怂了。

驱动这次突破的模型，是一个纯粹的通用大语言模型（General-purpose LLM）。核心研究员诺姆·布朗（Noam Brown）明确证实，该模型基于 OpenAI “o1” 推理架构的自然演进版本，在底层的神经网络中“没有针对此特定问题甚至数学领域本身进行过任何定向优化”。它不是一个外挂了大量几何规则的脚手架系统，而是一个在泛化知识基础上，依靠自身涌现出的因果逻辑能力进行运算的泛化智能体。

关于布朗，其实也相当值得介绍，为了节省篇幅，这里读完本文之后移步此前翻译的另一篇采访，了解这位从研究桌游外交游戏开始一步步突破 AI 推理极限的狠人。

总之，在研发的暗处，OpenAI 内部的研究员李杰（Lijie Chen）首先利用该通用模型，成功构建出了打破人类网格极限的反例；随后，马克·塞尔克（Mark Sellke）与梅塔布·索尼（Mehtaab Sawhney）进行了长达数月的内部逻辑排雷与正确性验证。在听取了数学家维克多·王（Victor Wang）的极度硬核建议后，团队将模型最初使用的“3-阶级域塔”论证，优化简化为了更为清晰的“2-阶级域塔”数论逻辑。

最终，这个通用大脑在对错误“零容忍”的数理拓扑空间中，凭空走完了几万步逻辑钢丝，生成了一份长达 125 页的、完全没有逻辑断裂的连续思维链（Chain-of-Thought, CoT）推导手稿。

为了确保学术上的绝对无瑕，在正式发布前，OpenAI 将这份 125 页的学术手稿以及一份消化后的精简备注，秘密发送给了包括诺加·阿隆（Noga Alon）和蒂莫西·高尔斯在内的 9 位全球最顶尖的独立数学家进行盲审和联合同行评议。

当高尔斯在秘密审查中连续数日翻阅这 125 页严丝合缝、调动了无数高阶定理的思维链后，这位曾摘得数学界最高荣誉的学者被彻底折服。这也直接催生了他在盲审评议后给出的至高背书：“如果这是一个人类数学家把这篇论文投给数学界最高期刊《数学年刊》（Annals of Mathematics），并且我被要求快速给个意见，我会毫不犹豫地建议 ‘直接接收’。在 AI 数学史上，没有任何先前的成就甚至能接近这一高度。”

当模式匹配被推向极致

高尔斯对 OpenAI 成果的高度赞誉，不仅是指 125 页论证在工程层面的零错误，更是指 AI 在解题思路中展现出的、打破人类数十年思维定势的“跨界原创性”。

“平面单位距离问题”的本质极其直观：在一个无限大的二维平面里安排个点，在严格的空间约束下，如何排列才能让相互之间距离恰好等于 1 米的“点对”数量达到最大化？

在过去的 80 年里，人类最聪明的头脑无一例外地陷入了“最佳实践的诅咒”。从埃尔德什本人在 1946 年的奠基性论文开始，几代数学家都坚信：将点如同国际象棋棋盘一般整齐排列的“正方形网格（Square Grid）”，就是这个宇宙中所能允许的效率极限。因为这种对称性过于直观和优雅，整个学术界都被权威共识洗脑了，默认埃尔德什的猜想不可动摇。