专访MIT邓明扬：从金牌满分，到师从何恺明Z Potentials

邓明扬现为 MIT 博士生，师从何恺明，主要研究生成模型。本科期间，他在 MIT 学习数学与计算机科学，也曾在 DeepMind 和 Meta 实习。更早之前，他曾获得 IMO 金牌和 IOI 金牌。2026 年，他以第一作者发表了 Drifting Models，尝试探索一种不同于传统路径的生成建模思路。

本期访谈，我们有幸邀请到了邓明扬。和他聊了聊他从竞赛到研究的经历，以及他对理论研究、生成模型和 AI 发展的一些看法。除了个人经历之外，访谈也涉及不少更具体的技术问题。

此外，邓明扬在与 ZP 的对谈中，还讨论了双方各自关注的研究方向与一些技术想法。话题主要围绕两个方面展开：一是如何让模型更好地处理和共享人类经验，包括 long context 与多模态输入；二是对生成模型范式的一些思考，例如是否应摆脱 diffusion、如何引入可扩展计算，以及语言与视觉统一建模的可能性。

Z Highlights

“我从竞赛中学到一个很重要的道理：很多问题其实没有想象中那么深奥。我最大的体会是世界其实是一个草台班子。也就是说，并不存在某种特别神秘、只有少数人才能想到的解法。”

“AI 给我一种创造东西的感觉……你写一些代码，然后它真的变成一个可以运行的系统，这种感觉会让我很开心。”

“在长期来看，很多结果其实是由噪声主导的，而不是你一开始看到的信号……很多重大进展，其实也是由这种黑天鹅事件推动的，而不是线性、可预测的演进。”

“很多 research 问题并不是通过讨论就能得出答案的。在那里反复讨论一个 idea，很多时候没有用……相比辩论，更重要的是去试。”

“人类有一种很特别的能力是 AI 还不具备的，可以叫做一种 few-shot 的泛化能力……未来人类的价值，可能就在于这种基于有限经验进行 generalization 的能力。”

“我更倾向于把 machine learning 看成是在点技能树……每一步是在点一个新的技能，最后这些技能会融合在一起，让模型变得非常强大。”

“我有一个比较暴论的看法是，很多问题的瓶颈，其实不在于模型的 capacity，而在于 optimization。也就是说，做某个任务的正确模型可能早就存在了，但问题在于怎么把这个模型训练出来。”

我们也将这些片段完整整理出来，供大家更加直观感受一线研究者们在真实语境中的思考与碰撞，enjoy！

ZP：欢迎明扬，非常高兴今天能与你交流。请你先按时间顺序向大家介绍一下自己。

邓明扬：大家好，我是邓明扬，现在是 MIT 二年级的 PhD，主要做生成模型。本科也是在 MIT 读的，本科阶段尝试过很多不同的方向，最后才决定做 machine learning，因为觉得这个方向特别适合自己。我高中是在国内读的，也是到了本科才出国。

ZP：你在高中阶段同时获得 IMO 和 IOI 金牌，这在全球都非常罕见。那个时期的你，为什么会走上竞赛道路？是天赋驱动、兴趣驱动，还是环境因素？

邓明扬：其实我走上计算机竞赛这条路是很自然的。因为我小时候特别喜欢写游戏，虽然当时还没有 AI，也不太会写代码，但我会自己去读一些比较基础的教材，然后尝试写一些能跑起来的东西。我觉得最有趣的地方在于：你有一个想法，然后这个想法可以在电脑上变成一个真实运行的东西，那种感觉特别有意思。所以我就一直在学编程。当时班里会编程的人很少，老师看到有人会写代码，就会把你拉去参加计算机竞赛，这个过程其实非常自然。

至于数学竞赛，更多是因为班上同学都在参加，我就跟着一起凑热闹。回过头来看，我觉得自己高中时期在竞赛上其实是比较 underfit，并没有特别系统、认真地去把该学的内容学扎实，更多是抱着玩的心态在做。但我从竞赛中学到一个很重要的道理：很多问题其实没有想象中那么深奥。我最大的体会是世界其实是一个草台班子。也就是说，并不存在某种特别神秘、只有少数人才能想到的解法。大多数题目，只要你认真去观察，把你能看到的所有性质列出来，再尝试把这些性质拼接起来，就有可能得到解法。

ZP：你本科在 MIT 同时主修数学和 EECS，最初对理论计算机科学非常投入，也发表了多篇 SODA、ICALP 论文。后来是什么契机让你逐渐转向了生成模型和 AI？

邓明扬：我本科的时候做过 TCS（ZP 注：理论计算机科学，Theoretical Computer Science）和数学，后来又做了 AI。从后来看，我个人在这三个学科做 research 的体验是很不一样的。如果打一个比方的话，我觉得 TCS research 更像是谈恋爱，做 TCS 的时候感觉自己生活在一个粉红色的泡泡里，觉得自己做的东西非常精妙，也能从中获得很多乐趣。这种乐趣其实很难对外人解释，他们也不太关心这个问题有没有很大的 impact，或者它在现实世界中的意义是什么，更重要的是在研究过程中获得的那种内在快乐。

数学的话，更像是科学家在发现真理。你会感觉自己在探索世界的一些基本维度，比如我本科做的是组合数学，其中有一些很有趣的点，比如傅立叶变换。你会发现，很多看起来完全不同的数学现象可以用一种完全不同的语言去描述。比如从频谱的角度来看问题，你会得到一种新的观察世界的方式。数学研究的魅力在于，它会告诉你世界的另一个维度，让你感觉自己在发现某种真相。

而 AI，更像是在闹革命。大家有很多不同的路线，每天都在争论哪条路线是对的，有的路线最后会成功，有的会失败。在这个过程中，大家对自己的研究方向是非常有执念的，会很在意自己是不是站在正确的那条革命路线上。相比之下，TCS 更像是自己开心就好，数学是在发现世界的真理，而 AI 则是在押注未来的方向，这是一个很不一样的思维方式。

ZP：那你觉得这种差异，是因为学科本身的不同，还是因为 AI 还处在一个比较混沌的发展阶段？

邓明扬：我觉得两方面都有可能。AI 现在确实处在一个比较混沌、快速发展的阶段，所以会有很多不同的路线在竞争。但另一方面，我觉得不同学科的人本身的世界观也确实不一样。比如在我接触的 TCS 方向中，我感觉做出巨大突破很有难度，所以大家更倾向于在自己喜欢的问题上深入钻研。所以我猜这种差异一部分来自学科的发展阶段，一部分来自这个领域长期形成的文化。

对我自己来说，一个很重要的原因是我不太喜欢纯理论。我觉得这个世界上，能够被严格证明的真理其实是非常有限的，但你能感受到的真理是非常多的。有很多道理，它更像是一种感觉或者一股劲，你很难把它完全用数学形式证明出来。但在数学和 TCS 里，你的结论必须是可以被严格证明的，写在纸上的，大家才会承认它。而在 AI 里，只要你通过实验观察到一些现象，并且你直觉上觉得它是对的，哪怕不能完全说服所有人，你也可以逐渐建立起自己的理解体系。这种通过直觉和实验去理解世界的方式让我觉得很有吸引力。而且这种方式，让你发现规律的速度，比依赖严格证明的学科要快很多。

还有一点是，AI 给我一种创造东西的感觉，就像我小时候写游戏一样。你写一些代码，然后它真的变成一个可以运行的系统，这种感觉会让我很开心。当然，我在做数学和 TCS 的时候也会觉得很快乐，但那种快乐更像是事后回想起来觉得挺开心的，而不是当下那种很强烈的创造感。

ZP：你早期在组合数学和算法方面的工作虽然和现在生成模型方向不同，但这些训练是否在你后来的研究中产生了影响？

邓明扬：我觉得有几个比较重要的点。首先是，我发现不同人的第一直觉是非常不一样的。也就是说，面对同一个问题，每个人最初的观察点和切入方式可能完全不同。早期经历让我形成了一个习惯：要尽量去感受不同人的观察方式，理解他们在想什么，然后把这些不同的 observation 融合在一起。很多时候，一些看起来零散、甚至有点莫名其妙的观察拼在一起之后就能 work。这也影响了我现在做 research 的方式。比如在 AI 领域，大家每天都会有很多不同的观点、不同的论据，我会比较习惯去看大家在辩什么，然后把这些东西吸收进来形成自己的理解。

我还形成了一个世界观是，大家其实菜得旗鼓相当（笑）。也就是说，大多数问题并不是只有极少数天才能解决的。很多问题，其实都存在一些相对简单的 observation，只要你把这些 observation 找出来，再和别人一起交流，把不同人的想法拼在一起，就能逐渐找到解题的方向。所以在方法论上，我现在也更倾向于和人多交流，去了解大家的第一感觉，然后把这些想法拼在一起。

ZP：如果让你给现在还在打竞赛的学生一些建议，比如在 AI 已经很强的背景下，他们做竞赛的意义或者未来学习和研究方向该如何规划？

邓明扬：关于竞赛的意义，我自己的经历其实是把它当作一件好玩的事情。当时我并没有投入特别多时间，更多是觉得它本身挺有趣的，甚至某种程度上是把它当成一个逃课的理由，去做一些自己更感兴趣的事情。但从结果来看，竞赛确实可以成为青春的一部分，如果你在过程中感到有趣，就会留下很多快乐的记忆，这本身就是一件很有价值的事情。

从能力培养的角度来看，我觉得竞赛其实在某种意义上是在做人类的 representation learning。它会训练你在 few-shot 场景下进行观察和归纳的能力，让你更容易从有限的信息中做出有效的判断。这种能力并不是某一个具体的技能点，而是一种更抽象的表征能力，而且我个人感觉它是可以泛化的，对之后做很多事情都会有帮助。

另外，我觉得最重要的一点还是要享受竞赛本身。在职业发展的角度上，我会觉得竞赛圈里有一种比较强的路径依赖或者 tendency。比如做信息学竞赛（OI）的人，往往会继续做 TCS；做数学竞赛的人，往往会继续走数学方向。回过头看自己的经历，我个人的体会是，其实不用那么早就把自己框定在某个路径里。进入大学之后，反而是一个很好的契机去探索不同的方向，能够感受自己到底对什么最感兴趣。因为很多时候，我们最开始接触并以为自己喜欢的东西，和最后真正契合自己的，可能并不完全是一回事。

整体来说，我会觉得竞赛更多还是图一乐。它可以带来一些旅行的机会，让你做自己喜欢的事情，同时锻炼一些抽象能力，比如 representation learning。至于竞赛成绩本身其实不必看得太重，本质上还是一种兴趣驱动的事情。

ZP：从竞赛到真正的研究，比如 TCS research，二者之间的 gap 大吗？竞赛能力强的人，对做研究有没有直接帮助？对于模型来说也是类似的问题，如果一个模型竞赛能力很强，它对做前沿研究会有帮助吗？

邓明扬：我自己的感受是，如果你去做 TCS 方向的研究，其实和竞赛的衔接是比较自然的。因为在很多情况下，TCS 的研究过程和做竞赛题是有相似性的，你面对的是一个相对 well-defined 的问题，然后你的目标是提出一个比前人更优或者更聪明的解法。从这个角度来看，两者之间的 gap 并不大，这也是为什么很多竞赛选手会倾向于继续做 TCS，我当时也有类似的感觉。

但如果是和 machine learning research，或者更偏数学研究相比，这个 gap 就会明显大很多。虽然竞赛中训练出来的一些能力，比如做观察（observation）的能力，是可以泛化的，但真正做研究时，一个很关键的点在于你需要自己决定什么问题是重要的。而在竞赛中，这一点其实并不被考察，因为题目已经给你了，你只需要去解。

除此之外，在方法论或者世界观层面，也有一些可以泛化的东西。比如我当时做竞赛时，很喜欢写一些 heuristic，就是你不完全知道它为什么有效，但实际跑起来是有效的。我觉得这种思维方式在研究中是可以迁移的。某种意义上，我甚至觉得做 research（尤其是 machine learning research）不需要那么严谨，更重要的是你能不能感受到某种规律或者直觉。

反而在竞赛中，大家通常会更严谨一些。如果你在竞赛阶段就非常严谨，那么到了研究阶段可能需要在世界观上做一些调整。总体来说，竞赛训练出来的一些直觉和观察能力是有价值的，但研究和竞赛在问题选择这一点上有本质区别。