专访MIT邓明扬:从金牌满分,到师从何恺明Z Potentials
邓明扬现为 MIT 博士生,师从何恺明,主要研究生成模型。本科期间,他在 MIT 学习数学与计算机科学,也曾在 DeepMind 和 Meta 实习。更早之前,他曾获得 IMO 金牌和 IOI 金牌。2026 年,他以第一作者发表了 Drifting Models,尝试探索一种不同于传统路径的生成建模思路。
本期访谈,我们有幸邀请到了邓明扬。和他聊了聊他从竞赛到研究的经历,以及他对理论研究、生成模型和 AI 发展的一些看法。除了个人经历之外,访谈也涉及不少更具体的技术问题。
此外,邓明扬在与 ZP 的对谈中,还讨论了双方各自关注的研究方向与一些技术想法。话题主要围绕两个方面展开:一是如何让模型更好地处理和共享人类经验,包括 long context 与多模态输入;二是对生成模型范式的一些思考,例如是否应摆脱 diffusion、如何引入可扩展计算,以及语言与视觉统一建模的可能性。
Z Highlights
“我从竞赛中学到一个很重要的道理:很多问题其实没有想象中那么深奥。我最大的体会是世界其实是一个草台班子。也就是说,并不存在某种特别神秘、只有少数人才能想到的解法。”
“AI 给我一种创造东西的感觉……你写一些代码,然后它真的变成一个可以运行的系统,这种感觉会让我很开心。”
“在长期来看,很多结果其实是由噪声主导的,而不是你一开始看到的信号……很多重大进展,其实也是由这种黑天鹅事件推动的,而不是线性、可预测的演进。”
“很多 research 问题并不是通过讨论就能得出答案的。在那里反复讨论一个 idea,很多时候没有用……相比辩论,更重要的是去试。”
“人类有一种很特别的能力是 AI 还不具备的,可以叫做一种 few-shot 的泛化能力……未来人类的价值,可能就在于这种基于有限经验进行 generalization 的能力。”
“我更倾向于把 machine learning 看成是在点技能树……每一步是在点一个新的技能,最后这些技能会融合在一起,让模型变得非常强大。”
“我有一个比较暴论的看法是,很多问题的瓶颈,其实不在于模型的 capacity,而在于 optimization。也就是说,做某个任务的正确模型可能早就存在了,但问题在于怎么把这个模型训练出来。”
我们也将这些片段完整整理出来,供大家更加直观感受一线研究者们在真实语境中的思考与碰撞,enjoy!
ZP:欢迎明扬,非常高兴今天能与你交流。请你先按时间顺序向大家介绍一下自己。
邓明扬:大家好,我是邓明扬,现在是 MIT 二年级的 PhD,主要做生成模型。本科也是在 MIT 读的,本科阶段尝试过很多不同的方向,最后才决定做 machine learning,因为觉得这个方向特别适合自己。我高中是在国内读的,也是到了本科才出国。
ZP:你在高中阶段同时获得 IMO 和 IOI 金牌,这在全球都非常罕见。那个时期的你,为什么会走上竞赛道路?是天赋驱动、兴趣驱动,还是环境因素?
邓明扬:其实我走上计算机竞赛这条路是很自然的。因为我小时候特别喜欢写游戏,虽然当时还没有 AI,也不太会写代码,但我会自己去读一些比较基础的教材,然后尝试写一些能跑起来的东西。我觉得最有趣的地方在于:你有一个想法,然后这个想法可以在电脑上变成一个真实运行的东西,那种感觉特别有意思。所以我就一直在学编程。当时班里会编程的人很少,老师看到有人会写代码,就会把你拉去参加计算机竞赛,这个过程其实非常自然。
至于数学竞赛,更多是因为班上同学都在参加,我就跟着一起凑热闹。回过头来看,我觉得自己高中时期在竞赛上其实是比较 underfit,并没有特别系统、认真地去把该学的内容学扎实,更多是抱着玩的心态在做。但我从竞赛中学到一个很重要的道理:很多问题其实没有想象中那么深奥。我最大的体会是世界其实是一个草台班子。也就是说,并不存在某种特别神秘、只有少数人才能想到的解法。大多数题目,只要你认真去观察,把你能看到的所有性质列出来,再尝试把这些性质拼接起来,就有可能得到解法。
ZP:你本科在 MIT 同时主修数学和 EECS,最初对理论计算机科学非常投入,也发表了多篇 SODA、ICALP 论文。后来是什么契机让你逐渐转向了生成模型和 AI?
邓明扬:我本科的时候做过 TCS(ZP 注:理论计算机科学,Theoretical Computer Science)和数学,后来又做了 AI。从后来看,我个人在这三个学科做 research 的体验是很不一样的。如果打一个比方的话,我觉得 TCS research 更像是谈恋爱,做 TCS 的时候感觉自己生活在一个粉红色的泡泡里,觉得自己做的东西非常精妙,也能从中获得很多乐趣。这种乐趣其实很难对外人解释,他们也不太关心这个问题有没有很大的 impact,或者它在现实世界中的意义是什么,更重要的是在研究过程中获得的那种内在快乐。
数学的话,更像是科学家在发现真理。你会感觉自己在探索世界的一些基本维度,比如我本科做的是组合数学,其中有一些很有趣的点,比如傅立叶变换。你会发现,很多看起来完全不同的数学现象可以用一种完全不同的语言去描述。比如从频谱的角度来看问题,你会得到一种新的观察世界的方式。数学研究的魅力在于,它会告诉你世界的另一个维度,让你感觉自己在发现某种真相。
而 AI,更像是在闹革命。大家有很多不同的路线,每天都在争论哪条路线是对的,有的路线最后会成功,有的会失败。在这个过程中,大家对自己的研究方向是非常有执念的,会很在意自己是不是站在正确的那条革命路线上。相比之下,TCS 更像是自己开心就好,数学是在发现世界的真理,而 AI 则是在押注未来的方向,这是一个很不一样的思维方式。
ZP:那你觉得这种差异,是因为学科本身的不同,还是因为 AI 还处在一个比较混沌的发展阶段?
邓明扬:我觉得两方面都有可能。AI 现在确实处在一个比较混沌、快速发展的阶段,所以会有很多不同的路线在竞争。但另一方面,我觉得不同学科的人本身的世界观也确实不一样。比如在我接触的 TCS 方向中,我感觉做出巨大突破很有难度,所以大家更倾向于在自己喜欢的问题上深入钻研。所以我猜这种差异一部分来自学科的发展阶段,一部分来自这个领域长期形成的文化。
对我自己来说,一个很重要的原因是我不太喜欢纯理论。我觉得这个世界上,能够被严格证明的真理其实是非常有限的,但你能感受到的真理是非常多的。有很多道理,它更像是一种感觉或者一股劲,你很难把它完全用数学形式证明出来。但在数学和 TCS 里,你的结论必须是可以被严格证明的,写在纸上的,大家才会承认它。而在 AI 里,只要你通过实验观察到一些现象,并且你直觉上觉得它是对的,哪怕不能完全说服所有人,你也可以逐渐建立起自己的理解体系。这种通过直觉和实验去理解世界的方式让我觉得很有吸引力。而且这种方式,让你发现规律的速度,比依赖严格证明的学科要快很多。
还有一点是,AI 给我一种创造东西的感觉,就像我小时候写游戏一样。你写一些代码,然后它真的变成一个可以运行的系统,这种感觉会让我很开心。当然,我在做数学和 TCS 的时候也会觉得很快乐,但那种快乐更像是事后回想起来觉得挺开心的,而不是当下那种很强烈的创造感。
ZP:你早期在组合数学和算法方面的工作虽然和现在生成模型方向不同,但这些训练是否在你后来的研究中产生了影响?
邓明扬:我觉得有几个比较重要的点。首先是,我发现不同人的第一直觉是非常不一样的。也就是说,面对同一个问题,每个人最初的观察点和切入方式可能完全不同。早期经历让我形成了一个习惯:要尽量去感受不同人的观察方式,理解他们在想什么,然后把这些不同的 observation 融合在一起。很多时候,一些看起来零散、甚至有点莫名其妙的观察拼在一起之后就能 work。这也影响了我现在做 research 的方式。比如在 AI 领域,大家每天都会有很多不同的观点、不同的论据,我会比较习惯去看大家在辩什么,然后把这些东西吸收进来形成自己的理解。
我还形成了一个世界观是,大家其实菜得旗鼓相当(笑)。也就是说,大多数问题并不是只有极少数天才能解决的。很多问题,其实都存在一些相对简单的 observation,只要你把这些 observation 找出来,再和别人一起交流,把不同人的想法拼在一起,就能逐渐找到解题的方向。所以在方法论上,我现在也更倾向于和人多交流,去了解大家的第一感觉,然后把这些想法拼在一起。
ZP:如果让你给现在还在打竞赛的学生一些建议,比如在 AI 已经很强的背景下,他们做竞赛的意义或者未来学习和研究方向该如何规划?
邓明扬:关于竞赛的意义,我自己的经历其实是把它当作一件好玩的事情。当时我并没有投入特别多时间,更多是觉得它本身挺有趣的,甚至某种程度上是把它当成一个逃课的理由,去做一些自己更感兴趣的事情。但从结果来看,竞赛确实可以成为青春的一部分,如果你在过程中感到有趣,就会留下很多快乐的记忆,这本身就是一件很有价值的事情。
从能力培养的角度来看,我觉得竞赛其实在某种意义上是在做人类的 representation learning。它会训练你在 few-shot 场景下进行观察和归纳的能力,让你更容易从有限的信息中做出有效的判断。这种能力并不是某一个具体的技能点,而是一种更抽象的表征能力,而且我个人感觉它是可以泛化的,对之后做很多事情都会有帮助。
另外,我觉得最重要的一点还是要享受竞赛本身。在职业发展的角度上,我会觉得竞赛圈里有一种比较强的路径依赖或者 tendency。比如做信息学竞赛(OI)的人,往往会继续做 TCS;做数学竞赛的人,往往会继续走数学方向。回过头看自己的经历,我个人的体会是,其实不用那么早就把自己框定在某个路径里。进入大学之后,反而是一个很好的契机去探索不同的方向,能够感受自己到底对什么最感兴趣。因为很多时候,我们最开始接触并以为自己喜欢的东西,和最后真正契合自己的,可能并不完全是一回事。
整体来说,我会觉得竞赛更多还是图一乐。它可以带来一些旅行的机会,让你做自己喜欢的事情,同时锻炼一些抽象能力,比如 representation learning。至于竞赛成绩本身其实不必看得太重,本质上还是一种兴趣驱动的事情。
ZP:从竞赛到真正的研究,比如 TCS research,二者之间的 gap 大吗?竞赛能力强的人,对做研究有没有直接帮助?对于模型来说也是类似的问题,如果一个模型竞赛能力很强,它对做前沿研究会有帮助吗?
邓明扬:我自己的感受是,如果你去做 TCS 方向的研究,其实和竞赛的衔接是比较自然的。因为在很多情况下,TCS 的研究过程和做竞赛题是有相似性的,你面对的是一个相对 well-defined 的问题,然后你的目标是提出一个比前人更优或者更聪明的解法。从这个角度来看,两者之间的 gap 并不大,这也是为什么很多竞赛选手会倾向于继续做 TCS,我当时也有类似的感觉。
但如果是和 machine learning research,或者更偏数学研究相比,这个 gap 就会明显大很多。虽然竞赛中训练出来的一些能力,比如做观察(observation)的能力,是可以泛化的,但真正做研究时,一个很关键的点在于你需要自己决定什么问题是重要的。而在竞赛中,这一点其实并不被考察,因为题目已经给你了,你只需要去解。
除此之外,在方法论或者世界观层面,也有一些可以泛化的东西。比如我当时做竞赛时,很喜欢写一些 heuristic,就是你不完全知道它为什么有效,但实际跑起来是有效的。我觉得这种思维方式在研究中是可以迁移的。某种意义上,我甚至觉得做 research(尤其是 machine learning research)不需要那么严谨,更重要的是你能不能感受到某种规律或者直觉。
反而在竞赛中,大家通常会更严谨一些。如果你在竞赛阶段就非常严谨,那么到了研究阶段可能需要在世界观上做一些调整。总体来说,竞赛训练出来的一些直觉和观察能力是有价值的,但研究和竞赛在问题选择这一点上有本质区别。


