顶级数学难题,现已被ChatGPT“终结”运营思维

2/22/2026

AI 正在悄悄攻克的,不是“刷题数学”,而是人类最骄傲的那一小撮“高智商数学自留地”。

而且,它不是高调进场,是偷偷把题解写完,放在你桌上那种。

一、事情本身有多“反直觉”?

过去我们对 AI 解数学的印象,大概停留在两种极端里:

一种是“高中竞赛题秒解,但一碰证明就开始胡扯”;

另一种是“看起来推得很长,其实在一本正经地编故事”。

结果这次不一样。

一个前量化研究员 Neel Somani,把一个埃尔德什级别的开放数学问题丢给了 ChatGPT,然后干了一件特别人类的事——去喝咖啡了。

15 分钟后回来,AI 不但给出了完整解法,还能被形式化工具 Harmonic 严格验证,每一步都站得住脚。

更离谱的是,它在推导过程中,能熟练调用一串你在数学史里才能看到的老朋友:

勒让德公式、贝特朗猜想、星形定理……

不是“我见过这个名词”,而是“我知道你现在该用谁”。

这不是算力,这是认知迁移。

二、最扎心的点在这:AI 不是照抄

有人第一反应是:“是不是又从 Math Overflow 翻答案了?”

确实,它找到了哈佛数学家 Noam Elkies 在 2013 年的一篇相关讨论。

但重点来了:

AI 最终给出的证明,和 Elkies 的思路并不等价,而且在埃尔德什原问题的版本上,解得更完整。

这一下,事情就变味了。

如果只是检索,那叫“学霸小抄”;

如果能在前人工作基础上,走出不同但正确的路径,那就叫“研究”。

而数学界对“研究”的门槛,向来比程序员圈残酷得多。

三、15 道埃尔德什问题被“清空”,不是巧合

更夸张的是,这不是孤例。

从圣诞节到现在,埃尔德什问题库里:

• 15 道问题从「Open」变成「Solved」

• 其中 11 道明确标注:AI 参与或主导

这在数学史上,是很不寻常的节奏。

要知道,这套问题本来就是人类留给人类的“智力长跑赛”,很多题不是难,而是不值得花十年去啃。

而这,恰好是 AI 最擅长的事情。

四、陶哲轩的一句话,点破本质

我特别喜欢陶哲轩在 Mastodon 上那段话,几乎是给 AI 定了位:

AI 更适合系统性地清理那些“长尾的、冷门的、但其实有解的埃尔德什问题”。

翻成人话就是:

这些题不是人类不会,而是不想花认知资源去做。

人类数学家要做的是:

提出新问题、构建新范式、打开新方向。

而 AI 非常适合做一件事:

把“散落在学术角落的潜在解法”一网打尽。

这不是取代,是分工重构。

五、真正被低估的,是“形式化”这条暗线

很多人盯着 GPT 5.2 的推理能力,却忽略了另一条更致命的变化:

数学正在被“工业化验证”。

Lean、Aristotle 这类工具的意义,不是让 AI 会做数学,

而是让“证明”从一种手工艺术,变成一种可复制流程。

以前一个数学家的脑子,是黑盒;

现在你可以把整个证明拆成机器可检查的零件。

当 AI 开始同时掌握:

• 自我校验

那它做的就不是“题目”,而是生产数学成果的流水线。

六、最危险的误判:这只是“数学圈的事”

如果你看到这还觉得“这和我没关系”,那我得泼一盆冷水。

数学不是终点,它是上游。

你今天看到 AI 解埃尔德什问题,

明天看到的,就是它在:

• 自动发现算法

• 推导新材料结构

• 优化金融模型

• 重构物理理论假设

当“抽象推理”被机器系统性接管之后,

真正被重新定价的,是人类的认知优势。

最后一句有点毒,但我真这么想

过去我们安慰自己说:

“AI 会算,但它不懂。”

现在的问题是:

如果“懂”这件事,本身就是一种可以被工程化的能力呢?

数学界已经开始认真对待这个可能性了。

接下来轮到的,可能不是你准备好的那一行。

你以为这是 AI 的高光时刻,

我反而觉得,这是人类重新定义“聪明”的前夜。

Scroll for more