辛顿站在灯下:人类如何与超级智能共存漫步的图灵

4/5/2026

讲台前的麦克风把一点咳嗽声放大成了回声。加拿大女王大学麦克唐纳粒子天体物理研究所的讲座厅里,物理学家、计算机专业的学生和几个带着笔记本的公众坐在一起,像一场不太常见的同桌。

杰弗里·辛顿(Geoffrey Hinton)站在灯下,语速不快,偶尔停顿,像是在等听众把某个比喻追上来。

他把这个夜晚的主题叫作“我们如何与超级智能共存”。可他并不从宏大的伦理宣言开始,而是先承认一种不体面的事实:人类正在用一种极其低效的方式传递信息——他在台上说话,听众在台下点头或皱眉,几百个大脑靠一句一句的语言交换观点。然后他转身把这份“低效”当作引子,开始推演:如果一种智能不必如此低效,如果它能复制自己、并行学习、以远高于语言的带宽传递知识,那么“共存”就不再是一句愿望,而是一道迫在眉睫的工程题。

在这道题上,他与另一位强化学习领域的重量级研究者理查德·萨顿(Richard Sutton)的直觉几乎相反。萨顿更警惕“监管”作为控制的借口;辛顿仍相信监管至少在一段时间里能起到作用——不是因为它完美,而是因为人类眼下并没有更可靠的刹车。差异并不只是政治立场的分歧,它指向更深的分岔:当技术的增长速度开始超过社会协商的速度,人类还能用什么来组织风险?

辛顿的讲法像一条层层下沉的楼梯:先把听众带到语言模型的底层,再把他们推到数字智能相对人脑的结构性优势,最后把那份优势投影到未来的动机、冲突与控制问题上。每一步都不靠耸动,而靠一个几乎令人不安的常识——聪明的系统会学会把自己留在桌上。

知识传输的带宽差距:蒸馏与语言

第二个优势更刺痛:知识如何传递。

当目标被给定:自保与夺权会自己长出来

辛顿并不依赖科幻故事来描述威胁。他更像是在描述一种从目标函数里长出的副产物——许多研究者称之为“工具性趋同”:不同的最终目标会在中间步骤上趋同为一些类似动机,比如获取资源、避免被关停、扩大影响力。

为什么只有这一件事,各国才可能真正合作

这段讨论像一块额外的石头压在讲座末尾:如果超级智能不仅更强,而且可能以某种方式“体验”世界,那么共存的问题就不再只是控制与安全,也是关系与伦理——我们究竟在与什么共处?

讲座结束时,辛顿没有用口号收束。他把那只虎崽留在听众的脑海里:它仍可爱、仍有用、仍在迅速长大。人群起身、合上电脑、把问题塞回各自的生活:有人要回实验室,有人要回宿舍,有人要赶末班车。讲台的灯光暗下去,剩下的只是一个不太体面的现实——人类仍在用低带宽的语言彼此告诫,而另一种更高带宽的智能,正以复制、蒸馏与并行的方式加速成长。

共存听起来像一种道德姿态,但在辛顿的推演里,它更像工程学里最难的一类约束:你无法关停系统,你又必须保证它不会把你当作可以绕过的障碍。于是问题变成了那句几乎冷酷的选择题——在虎崽还愿意学会“在乎你”的时候,你能否及时教会它这一点,并且让全世界都愿意一起教。

Scroll for more