北大老师太狠了,结果意想不到中时新闻网
12/26/2025
据报道,在北京大学化学与分子工程学院,有机化学考试是许多同学痛并快乐著的挑战。然而,期中考前突如其来的一条通知,却让这场考试的气氛变得不同寻常:“请注意,本次考试范围不仅限于有机化学。” 但比起考试范围的变化,考场里迎来的一批“特殊考生”,更让人意想不到。
它们不需要落座,也无需纸笔。它们是GPT、Gemini、DeepSeek……这些当下世界上最聪明的AI,正在云端与174位北大化学与分子工程学院的大二学生同场竞技。
这是一场精心设计的“图灵测试”,也是北大科研团队为大语言模型投下的一块“试金石”。
近日,北京大学化学与分子工程学院联合北大计算中心、计算机学院、元培学院团队,发布了最新成果SUPERChem。近期,他们以一套“北大试卷”为标尺,冷静丈量著AI在科学推理上的真实边界。
打开SUPERChem的题库,一种“压迫感”扑面而来。
晶体结构的精细解析、反应机理的深度推演、物化性质的定量计算……这500道题目并非来自网络上随手可得的公开题库,而是源于对高难度试题和前沿专业文献的深度改编。
“因为大模型太会『背书』了。”团队成员解释道。互联网可及的测试题大多已被博闻强识的AI在训练阶段熟读。而化学,恰恰是一门不能只靠死记硬背的学科。它既有严密的逻辑推演,又充满了对微观世界的空间想象。“我们非常好奇,大语言模型的1D next token prediction,能否解决2D、甚至3D空间中的复杂推理问题。”


