一条真实可见的长队:清华宋士吉团队火了杨泽远

12/13/2025

在今年的 NeurIPS 主会场,我亲眼见证了一个极少出现的场景:

演讲一结束,美国教授、研究员、工程师在麦克风前排出了一条真实可见的长队。每个人都迫不及待地想向台上的中国作者提问。

这种场景让我意识到,中国科研正在成为世界舞台的中心。

而点燃全场讨论热潮的,正是清华大学自动化系宋士吉、黄高团队带来的论文《强化学习是否真的能激发大语言模型产生超越基础模型的推理能力?》

并一举拿下本届 NeurIPS 的最佳论文亚军奖,被誉为“AI 奥斯卡”的最高荣誉之一。

这篇论文由博士生乐洋、本科生陈之琪共同一作完成,所挑战的问题是,当前大模型界几乎人人默认的一个“真理”:

Scroll for more