被ChatGPT推翻，陈立杰惊呼：太不可思议新智元

GPT-5.5 Pro 生成了一个数学证明，解决了计算几何中一个陈立杰苦思 7 年未解的核心难题。关键技术来自 OpenAI 上月的另一项突破，而最初推进这个问题的陈立杰发现，钥匙竟是自己参与的工作。

6 月 24 日，arXiv 上出现了一篇论文：UCSD 三位研究者 Barna Saha、Yinzhan Xu 和 Christopher Ye 证明，「最远点对」等经典计算几何问题，在任意超常数维度下需要近平方时间。

论文声明，初始证明由 GPT-5.5 Pro 生成。

给 AI 的 Prompt 只有两句话，大意就是「试试用这个证明思路去改进那个已知结果」，附上两篇论文链接。

这个问题 7 年前由陈立杰首次推进到接近极限，而补上最后一块拼图的关键技术，恰好来自他自己上个月在 OpenAI 参与的另一项工作。

陈立杰在 X 上惊呼，「This is incredible!!!」

陈立杰想了 7 年的问题

陈立杰是算法圈顶级天才，IOI 金牌得主，本科毕业于清华姚班，博士前往 MIT 师从理论计算机科学家 Ryan Williams，毕业后入职加州伯克利担任助理教授，现任职 OpenAI，是理论计算机科学领域最受关注的青年学者之一。

2018 年，他读博的第一篇论文就在这个问题上取得了关键进展，把维度下界推到了 2Θ(log* n)。

log* 是一个增长极其缓慢的函数，拿宇宙中原子总数那样大的数去算 log*，结果也才 5 左右。

他已经把下界逼到了一个几乎不增长的门槛前，再往下推就撞到了硬墙。

此后 7 年，断断续续地想，始终没能跨过去。

上个月，他在 OpenAI 参与了对 Erdős 单位距离猜想的反证。

这篇新论文的作者们随后发现，那项工作中的代数数论技术，恰恰是跨过最后一步所需要的。

这个重大猜想具体是什么意思呢？

想象一个体育馆里坐了一万人，要找出坐得最远的两个。

如果体育馆是个平面，用两个坐标描述每个人的位置，有很聪明的算法可以快速搞定。

但如果每个人的「位置」需要用 100 个、1000 个数来描述呢？这就进入了高维空间。

目前最好的算法运行时间大致是 n2-c/d，n 是点的数量，d 是维度，c 是常数。

维度低时指数明显小于 2，有捷径可走；维度一高，指数逼近 2，退化成把每两个人都比一遍的暴力方法。

这篇论文回答的核心问题是，算法不够聪明，还是问题天生就这么难？

答案是后者。

只要维度在增长，哪怕增长得慢到 log log log log n（一个对天文数字来说也才等于 2 的速度），就不可能存在真正快于 n² 的算法。现有算法的表现已经基本是极限。

同一结论还覆盖了一整个问题家族，双色最近点对、最大内积搜索、Hopcroft 问题，全部适用。

补充一个前提——结论的成立依赖 SETH（强指数时间假设），它说的是 SAT 问题（判断一个布尔公式能否被满足）不存在比暴力搜索快很多的算法。

这个假设被广泛认为成立，理论计算机科学中大量下界结论都建立在它之上。

卡点：质数太稀疏了

之前所有攻克方法共享一个核心思路。

把长向量切成 L 个小块，每块 b 位。

对每个小块用不同的质数取余数，中国剩余定理保证，如果一个数对足够多个不同的质数取余都得零，那这个数本身就是零。

所以只要用 b 个不同的质数分别检验每一位，就能判断两个向量的内积是否为零。

问题出在「足够多」三个字上。

b 个不同的质数，最小也得排到第 b 个质数，大约是 b log b。

这些质数的乘积随 b 指数级增长，编码出来的数字大到离谱。

当维度很低、每块位数 b 很大时，编码的计算开销比原问题还重，整个方法就失效了。

陈立杰 2020 年用递归技巧把这个矛盾压到了极限。

再往下，「质数密度不够大」这堵墙翻不过去。

破局：在另一个数学世界里让质数「裂开」

转机来自一个看起来完全不相关的方向。

大家都学过复数，在实数基础上引入 i（满足 i² = -1），得到一个新的数系，加减乘除规则不变，但多了一个维度，可以做更多事情。

数学家发现同样的操作可以推广。

往有理数（就是所有分数）里加入某个特定的根，就能造出一个新的数系，叫做「数域」。

比如加入 √2，得到所有形如 a + b√2 的数（a、b 是有理数）。

这个新数系和普通数一样可以正常做加减乘除，也有自己版本的「整数」（叫整数环），也有自己版本的「质数」（叫素理想）。

关键在这里。

在普通整数世界里，7 是质数，不可拆分。

但在包含 √2 的数域里，7 可以写成 (3+√2)(3−√2)。

一个原本不可分割的质数，裂成了两个因子，每个因子在新数系里各自充当「质数」的角色。