一条真实可见的长队:清华宋士吉团队火了杨泽远
12/13/2025
在今年的 NeurIPS 主会场,我亲眼见证了一个极少出现的场景:
演讲一结束,美国教授、研究员、工程师在麦克风前排出了一条真实可见的长队。每个人都迫不及待地想向台上的中国作者提问。
这种场景让我意识到,中国科研正在成为世界舞台的中心。
而点燃全场讨论热潮的,正是清华大学自动化系宋士吉、黄高团队带来的论文《强化学习是否真的能激发大语言模型产生超越基础模型的推理能力?》
并一举拿下本届 NeurIPS 的最佳论文亚军奖,被誉为“AI 奥斯卡”的最高荣誉之一。
这篇论文由博士生乐洋、本科生陈之琪共同一作完成,所挑战的问题是,当前大模型界几乎人人默认的一个“真理”:


