陶哲轩直言:现代AI的数学门槛没那么高跟着大咖学AI
著名数学家、菲尔兹获得者陶哲轩在最近的一次视频访谈中谈到AI并发表了自己的观点。他认为,训练和运行大语言模型和其他现代AI所需的数学知识并不高深,本科数学专业的基础就足够支撑,核心只需掌握矩阵乘法和基础微积分。
人类早已掌握大语言模型的搭建、训练和运行方法,真正的核心难题并非“如何让模型跑起来”,而是缺乏可靠的理论框架来提前预测其任务表现。
『 训练和运行大语言模型(或其他现代 AI)所需的数学知识并没有那么复杂。本科数学专业的学生就已经具备了必要的相关知识 —— 本质上,你只需要掌握矩阵乘法和一点微积分就行。
The mathematics required to train and run a large language model (or any other modern AI) isn’t that complicated. An undergraduate math major already has all the necessary prerequisites—basically, you just need to understand matrix multiplication and a bit of calculus.
真正的难点不在于让这些模型 “如何运行”,我们已经知道怎么构建、训练和操作大语言模型了。难点在于理论层面我们缺少可靠的方法来评估或预测它们的性能。
The real challenge isn’t how these models run (we know how to build, train, and operate large language models). Instead, the problem lies in theory: we lack a reliable way to evaluate or predict their performance. 让人意外的是,这些模型在某些任务上表现极佳,在另一些任务上却效果很差,但我们没法提前预判哪些任务会是哪种情况。我们甚至连基础的经验法则都没有,只能依赖实证实验。
What’s surprising is that these models work extremely well for some tasks but poorly for others—and we can’t predict which tasks will fall into which category in advance. We don’t even have basic heuristic rules of thumb for this; we can only rely on empirical experiments.』


