陶哲轩“正在哥白尼”:人类智能不再是宇宙中心DeepTech深科技

3/22/2026

过去半年,AI 在数学领域的进展令人目不暇接。2025 年 10 月,OpenAI 声称 GPT-5 解决了多道 Erdős 难题,随后被证实其中大部分只是文献检索,找到了数据库维护者尚未收录的已发表论文。

但到了 2026 年 1 月,情况发生了实质变化:GPT-5.2 Pro 在一周内攻克了三道 Erdős 难题(#397、#728、#729),生成的证明经 Lean 形式化验证后被陶哲轩本人接受,且这些证明在已有文献中找不到先例。

据《科学美国人》2026 年 2 月的报道,AI 工具迄今已帮助将约 100 道 Erdős 问题转入“已解决”状态。与此同时,多位顶尖数学家开始向 AI 实验室靠拢:哥伦比亚大学的 Mehtaab Sawhney 休学加入了 OpenAI,另一位研究者 Pagano 也入职了 Google DeepMind。

就在这个节点上,3 月 20 日,菲尔兹奖得主陶哲轩做客 Dwarkesh Podcast,从开普勒发现行星运动定律的故事讲起,深入谈论了 AI 正在如何改变数学与科学研究的方式。他在 2023 年曾预测到 2026 年 AI 将成为数学研究中“值得信赖的合著者”,如今他对这个预测表示满意。但他也坦言,AI 让他的论文更丰富了,核心突破仍然要靠纸笔完成。

(来源:YouTube)

对话核心要点如下:

• 陶哲轩 2023 年预测“到 2026 年 AI 将成为数学研究中值得信赖的合著者”,他认为这个预测基本兑现;

• AI 工具已帮助解决约 50 道 Erdős 难题(据《科学美国人》报道已接近 100 道),但纯 AI 一击命中的解题已经停滞,剩余问题的成功率约为 1%–2%;

• AI 将想法生成的成本降到了接近于零,但验证和评估成为了新的瓶颈,科学界的同行评审体系正在被 AI 生成的投稿淹没;

• 陶哲轩的论文现在包含更多代码和图表,如果没有 AI 工具,写出同类论文要花五倍时间;但数学问题中最核心的突破部分仍然依赖纸笔;

• AI 擅长广度,人类擅长深度,二者高度互补;陶哲轩认为人机混合将在数学领域占据主导地位更长时间;

• 他认为数学需要一种描述“策略”而非仅仅“证明”的半形式化语言,但目前还不知道这种语言该是什么样的;

• 对年轻人的建议:心态要足够灵活,传统教育仍然重要,但要对全新的参与科学的方式保持开放。

以下是这场对话的编译全文。

Patel:我想先请你讲讲开普勒发现行星运动定律的故事,因为我觉得这会是一个很好的跳板,让我们从这里开始聊 AI 与数学。

陶哲轩:好的。我一直对天文学有业余的兴趣,也很喜欢早期天文学家如何推算出宇宙本质的故事。开普勒是在哥白尼的工作基础上进行研究的,而哥白尼本人又继承了阿里斯塔克斯(Aristarchus)的思路。哥白尼最著名的贡献是提出了日心说模型:不是行星和太阳围绕地球转,而是太阳位于太阳系中心,其他行星围绕太阳运行。哥白尼认为行星的轨道是完美的圆形,他的理论在一定程度上与希腊人、阿拉伯人和印度人数百年来积累的观测数据吻合。

我觉得开普勒应该是在求学过程中接触到了这些理论,然后他注意到,哥白尼所预测的各行星轨道的大小比例似乎蕴含着某种几何意义。他开始提出这样一种想法:比如你取地球的轨道,把它嵌入一个立方体中,那么包围这个立方体的外接球几乎完美地吻合火星的轨道,依此类推。

当时已知有六颗行星,行星之间有五个间隔,而恰好有五种正则柏拉图立体:立方体、正四面体、正八面体、正十二面体和正二十面体。所以他提出了一个他认为极其美妙的理论,认为可以在各行星的球面之间嵌入这些柏拉图立体。数据看上去确实吻合。对他来说,这意味着上帝设计行星的方式恰恰对应了柏拉图立体的数学完美性。

为了验证这个理论,他需要数据。当时几乎只存在一套真正高质量的数据集,来自第谷·布拉赫(Tycho Brahe)。这位丹麦天文学家非常富有而又性情古怪,他说服了丹麦政府资助一座极其昂贵的天文台,实际上是一整座岛。他在那里持续了几十年,每天晚上(至少是天气晴朗的每个晚上)用肉眼观测所有行星的位置。他是最后一批纯肉眼天文学家。他拥有的数据正是开普勒验证理论所需要的。

图丨开普勒与布拉赫雕塑(来源:WikiPedia)

开普勒开始与布拉赫合作,但布拉赫对自己的数据非常吝啬,每次只给一点点。据说开普勒最终偷了数据,偷偷抄了一份,还跟布拉赫的后人闹了一场。但他确实拿到了数据,然后他发现,令他颇为失望的是,那个美妙的理论并不完全成立。数据与柏拉图立体理论大约偏差了 10%。

他想了各种办法来调整,挪动圆的位置之类的,但就是不太对。他在这个问题上钻研了很多年,最终找到了一种方法,利用数据推算出行星的实际轨道。那是一项了不起的数据分析工作。最终他发现行星轨道其实是椭圆而非圆形,这让他很震撼。

他推导出了行星运动的前两条定律:椭圆轨道,以及等面积等时间定律(即行星与太阳的连线在相等时间内扫过相等的面积)。然后又过了十年,在积累了更多数据之后(最远的行星如土星和木星是他最难搞定的),他最终推导出第三定律:行星完成一个轨道周期所需的时间,与它到太阳距离的某个幂次成正比。这就是著名的三大运动定律。对开普勒而言,这些完全是由实验数据驱动的。要到一个世纪后,牛顿才给出了一个统一的理论来解释这三条定律。

Patel:我想提出一个看法,来看你怎么评价:开普勒就像一个“高温度”的大语言模型(high temperature LLM)。牛顿后来解释了行星运动三定律为何必然成立。开普勒推算出各行星相对轨道的方式,正如你所说,确实是天才之举。但纵观他的整个学术生涯,他一直在尝试各种随机的联系。

事实上,在他写下第三定律的那本书《世界的和声》里,第三定律几乎是一笔带过。那本书的主题是关于不同行星拥有不同的和声,地球上之所以充满饥荒和苦难,是因为地球的音符是“mi”和“fa”。所以大量的内容是随机的占星学,但其中夹着立方平方定律(cube-square law),告诉你行星周期与到太阳距离之间的关系。如果把这条定律加上牛顿的 F=ma 和向心加速度公式,就能推导出引力的平方反比定律。牛顿就是这样推导出来的。

我觉得这个故事之所以有趣,是因为我感觉大语言模型可以做开普勒那种事情:花 20 年尝试各种随机联系,其中有些完全没道理,只要有一个可验证的数据库(就像布拉赫的数据集),那就行。我要试试关于音符的随机想法,试试关于柏拉图立体的随机想法,试试各种不同的几何。我有一个偏见,觉得这些轨道的几何关系中一定有什么重要的东西。然后其中有一个想法成功了。只要你能验证它,这些经验规律就可以推动真正深层的科学进步。

陶哲轩:传统上,当我们谈论科学史的时候,“想法的生成”一直是科学中最有声望的环节。一个科学问题涉及很多步骤:你必须先识别一个问题,然后判断它是不是一个好问题。然后你需要收集数据,想出分析数据的策略,提出假说。到了这一步,你需要提出一个好的假说,然后验证它,然后还要写出来、解释清楚,涉及十几个不同的环节。但我们庆祝的确实是那些灵光乍现的“尤里卡”时刻,也就是想法的生成。

开普勒当然必须像你说的那样,循环尝试很多想法,其中好几个不管用。我敢打赌还有很多他根本没发表的,因为数据就是对不上。这是过程中很重要的一部分:尝试各种随机的东西,看看哪个行得通。但正如你所说,这必须配合同等规模的验证工作,否则就太慢了。

我的意思是,我们纪念开普勒,但也应该同样纪念布拉赫。他那种一丝不苟的数据收集比之前的任何观测精确了十倍。而那个额外的小数点的精度对开普勒得出他的结论至关重要。他当时使用的是欧几里得几何,以及他所能掌握的最先进数学来拟合数据模型。所以各个方面都必须到位:数据、理论、以及假说的生成。

我不确定如今假说生成还是不是瓶颈了。从那以来科学发生了很多变化。经典上,科学有两大范式:理论和实验。20 世纪又加入了数值模拟,你可以通过计算机模拟来检验理论。

再往后,到了 20 世纪末,我们进入了大数据时代,数据分析成了新的驱动力。现在很多新进展实际上是通过分析海量数据集驱动的:先收集大量数据,然后从中发现规律来推导想法。这和科学过去的运作方式有些不同。过去是你先做几次观测,或者凭空冒出一个想法,然后收集数据来检验它。这是经典的科学方法。

Scroll for more