一条真实可见的长队：清华宋士吉团队火了杨泽远

在今年的 NeurIPS 主会场，我亲眼见证了一个极少出现的场景：

演讲一结束，美国教授、研究员、工程师在麦克风前排出了一条真实可见的长队。每个人都迫不及待地想向台上的中国作者提问。

这种场景让我意识到，中国科研正在成为世界舞台的中心。

而点燃全场讨论热潮的，正是清华大学自动化系宋士吉、黄高团队带来的论文《强化学习是否真的能激发大语言模型产生超越基础模型的推理能力？》

并一举拿下本届 NeurIPS 的最佳论文亚军奖，被誉为“AI 奥斯卡”的最高荣誉之一。

这篇论文由博士生乐洋、本科生陈之琪共同一作完成，所挑战的问题是,当前大模型界几乎人人默认的一个“真理”：