陶哲轩“正在哥白尼”：人类智能不再是宇宙中心DeepTech深科技

过去半年，AI 在数学领域的进展令人目不暇接。2025 年 10 月，OpenAI 声称 GPT-5 解决了多道 Erdős 难题，随后被证实其中大部分只是文献检索，找到了数据库维护者尚未收录的已发表论文。

但到了 2026 年 1 月，情况发生了实质变化：GPT-5.2 Pro 在一周内攻克了三道 Erdős 难题（#397、#728、#729），生成的证明经 Lean 形式化验证后被陶哲轩本人接受，且这些证明在已有文献中找不到先例。

据《科学美国人》2026 年 2 月的报道，AI 工具迄今已帮助将约 100 道 Erdős 问题转入“已解决”状态。与此同时，多位顶尖数学家开始向 AI 实验室靠拢：哥伦比亚大学的 Mehtaab Sawhney 休学加入了 OpenAI，另一位研究者 Pagano 也入职了 Google DeepMind。

就在这个节点上，3 月 20 日，菲尔兹奖得主陶哲轩做客 Dwarkesh Podcast，从开普勒发现行星运动定律的故事讲起，深入谈论了 AI 正在如何改变数学与科学研究的方式。他在 2023 年曾预测到 2026 年 AI 将成为数学研究中“值得信赖的合著者”，如今他对这个预测表示满意。但他也坦言，AI 让他的论文更丰富了，核心突破仍然要靠纸笔完成。

（来源：YouTube）

对话核心要点如下：

• 陶哲轩 2023 年预测“到 2026 年 AI 将成为数学研究中值得信赖的合著者”，他认为这个预测基本兑现；

• AI 工具已帮助解决约 50 道 Erdős 难题（据《科学美国人》报道已接近 100 道），但纯 AI 一击命中的解题已经停滞，剩余问题的成功率约为 1%–2%；

• AI 将想法生成的成本降到了接近于零，但验证和评估成为了新的瓶颈，科学界的同行评审体系正在被 AI 生成的投稿淹没；

• 陶哲轩的论文现在包含更多代码和图表，如果没有 AI 工具，写出同类论文要花五倍时间；但数学问题中最核心的突破部分仍然依赖纸笔；

• AI 擅长广度，人类擅长深度，二者高度互补；陶哲轩认为人机混合将在数学领域占据主导地位更长时间；

• 他认为数学需要一种描述“策略”而非仅仅“证明”的半形式化语言，但目前还不知道这种语言该是什么样的；

• 对年轻人的建议：心态要足够灵活，传统教育仍然重要，但要对全新的参与科学的方式保持开放。

以下是这场对话的编译全文。

Patel：我想先请你讲讲开普勒发现行星运动定律的故事，因为我觉得这会是一个很好的跳板，让我们从这里开始聊 AI 与数学。

陶哲轩：好的。我一直对天文学有业余的兴趣，也很喜欢早期天文学家如何推算出宇宙本质的故事。开普勒是在哥白尼的工作基础上进行研究的，而哥白尼本人又继承了阿里斯塔克斯（Aristarchus）的思路。哥白尼最著名的贡献是提出了日心说模型：不是行星和太阳围绕地球转，而是太阳位于太阳系中心，其他行星围绕太阳运行。哥白尼认为行星的轨道是完美的圆形，他的理论在一定程度上与希腊人、阿拉伯人和印度人数百年来积累的观测数据吻合。

我觉得开普勒应该是在求学过程中接触到了这些理论，然后他注意到，哥白尼所预测的各行星轨道的大小比例似乎蕴含着某种几何意义。他开始提出这样一种想法：比如你取地球的轨道，把它嵌入一个立方体中，那么包围这个立方体的外接球几乎完美地吻合火星的轨道，依此类推。

当时已知有六颗行星，行星之间有五个间隔，而恰好有五种正则柏拉图立体：立方体、正四面体、正八面体、正十二面体和正二十面体。所以他提出了一个他认为极其美妙的理论，认为可以在各行星的球面之间嵌入这些柏拉图立体。数据看上去确实吻合。对他来说，这意味着上帝设计行星的方式恰恰对应了柏拉图立体的数学完美性。

为了验证这个理论，他需要数据。当时几乎只存在一套真正高质量的数据集，来自第谷·布拉赫（Tycho Brahe）。这位丹麦天文学家非常富有而又性情古怪，他说服了丹麦政府资助一座极其昂贵的天文台，实际上是一整座岛。他在那里持续了几十年，每天晚上（至少是天气晴朗的每个晚上）用肉眼观测所有行星的位置。他是最后一批纯肉眼天文学家。他拥有的数据正是开普勒验证理论所需要的。

图丨开普勒与布拉赫雕塑（来源：WikiPedia）

开普勒开始与布拉赫合作，但布拉赫对自己的数据非常吝啬，每次只给一点点。据说开普勒最终偷了数据，偷偷抄了一份，还跟布拉赫的后人闹了一场。但他确实拿到了数据，然后他发现，令他颇为失望的是，那个美妙的理论并不完全成立。数据与柏拉图立体理论大约偏差了 10%。

他想了各种办法来调整，挪动圆的位置之类的，但就是不太对。他在这个问题上钻研了很多年，最终找到了一种方法，利用数据推算出行星的实际轨道。那是一项了不起的数据分析工作。最终他发现行星轨道其实是椭圆而非圆形，这让他很震撼。

他推导出了行星运动的前两条定律：椭圆轨道，以及等面积等时间定律（即行星与太阳的连线在相等时间内扫过相等的面积）。然后又过了十年，在积累了更多数据之后（最远的行星如土星和木星是他最难搞定的），他最终推导出第三定律：行星完成一个轨道周期所需的时间，与它到太阳距离的某个幂次成正比。这就是著名的三大运动定律。对开普勒而言，这些完全是由实验数据驱动的。要到一个世纪后，牛顿才给出了一个统一的理论来解释这三条定律。

Patel：我想提出一个看法，来看你怎么评价：开普勒就像一个“高温度”的大语言模型（high temperature LLM）。牛顿后来解释了行星运动三定律为何必然成立。开普勒推算出各行星相对轨道的方式，正如你所说，确实是天才之举。但纵观他的整个学术生涯，他一直在尝试各种随机的联系。

事实上，在他写下第三定律的那本书《世界的和声》里，第三定律几乎是一笔带过。那本书的主题是关于不同行星拥有不同的和声，地球上之所以充满饥荒和苦难，是因为地球的音符是“mi”和“fa”。所以大量的内容是随机的占星学，但其中夹着立方平方定律（cube-square law），告诉你行星周期与到太阳距离之间的关系。如果把这条定律加上牛顿的 F=ma 和向心加速度公式，就能推导出引力的平方反比定律。牛顿就是这样推导出来的。

我觉得这个故事之所以有趣，是因为我感觉大语言模型可以做开普勒那种事情：花 20 年尝试各种随机联系，其中有些完全没道理，只要有一个可验证的数据库（就像布拉赫的数据集），那就行。我要试试关于音符的随机想法，试试关于柏拉图立体的随机想法，试试各种不同的几何。我有一个偏见，觉得这些轨道的几何关系中一定有什么重要的东西。然后其中有一个想法成功了。只要你能验证它，这些经验规律就可以推动真正深层的科学进步。

陶哲轩：传统上，当我们谈论科学史的时候，“想法的生成”一直是科学中最有声望的环节。一个科学问题涉及很多步骤：你必须先识别一个问题，然后判断它是不是一个好问题。然后你需要收集数据，想出分析数据的策略，提出假说。到了这一步，你需要提出一个好的假说，然后验证它，然后还要写出来、解释清楚，涉及十几个不同的环节。但我们庆祝的确实是那些灵光乍现的“尤里卡”时刻，也就是想法的生成。

开普勒当然必须像你说的那样，循环尝试很多想法，其中好几个不管用。我敢打赌还有很多他根本没发表的，因为数据就是对不上。这是过程中很重要的一部分：尝试各种随机的东西，看看哪个行得通。但正如你所说，这必须配合同等规模的验证工作，否则就太慢了。

我的意思是，我们纪念开普勒，但也应该同样纪念布拉赫。他那种一丝不苟的数据收集比之前的任何观测精确了十倍。而那个额外的小数点的精度对开普勒得出他的结论至关重要。他当时使用的是欧几里得几何，以及他所能掌握的最先进数学来拟合数据模型。所以各个方面都必须到位：数据、理论、以及假说的生成。

我不确定如今假说生成还是不是瓶颈了。从那以来科学发生了很多变化。经典上，科学有两大范式：理论和实验。20 世纪又加入了数值模拟，你可以通过计算机模拟来检验理论。

再往后，到了 20 世纪末，我们进入了大数据时代，数据分析成了新的驱动力。现在很多新进展实际上是通过分析海量数据集驱动的：先收集大量数据，然后从中发现规律来推导想法。这和科学过去的运作方式有些不同。过去是你先做几次观测，或者凭空冒出一个想法，然后收集数据来检验它。这是经典的科学方法。