从黑暗到黎明—杰弗里·辛顿的那些事儿无聊的白日幻想家

6/16/2026

2012年秋天,一场比赛的排名传遍人工智能领域。在ImageNet图像识别大赛上,一个来自多伦多大学的团队以压倒性优势夺冠。他们的神经网络AlexNet错误率比第二名低了十个百分点以上,几乎将此前公认难以企及的基准线一刀斩断。领队是一位年过六旬的英国裔教授,两鬓花白,说话带着温和的咬字,在庆祝声浪中却显得异常平静。

他叫杰弗里·辛顿。为了这一刻,他在极其孤独的道路上已经走了三十多年。当整个学术圈把他的研究方向视为“注定失败的死胡同”时,他独自坐在那间堆满论文的小办公室里,一遍遍把神经网络的方程推到纸上,等了整整一个长夜。

被姓氏压住的孩子

1947年12月6日,杰弗里·埃弗莱斯特·辛顿出生在伦敦温布尔登。这个家族的科学谱系厚得令人透不过气。

他的曾曾祖父是乔治·布尔,数理逻辑的创始人,布尔代数的命名者——今天每一块芯片内部的运算,都运行在布尔逻辑之上。布尔的妻子玛丽·埃弗莱斯特是数学家兼教育思想家,写过畅销的儿童数学启蒙书。他们的五个女儿中,艾丽西娅·布尔·斯托特以四维几何研究闻名——在没有计算机的年代,她全凭直觉想象出四维空间中六种正多面体的三维截面模型。长女玛丽·埃伦嫁给了数学家查尔斯·霍华德·辛顿,即杰弗里的外曾祖父,这位辛顿痴迷于第四维度,发明了“超立方体”一词,设计过用彩色方块帮助人们想象四维空间的装置。杰弗里的外祖父查尔斯·霍华德·辛顿同样是数学家,提出了四维空间几何的早期概念。到了父亲这一辈,霍华德·埃弗莱斯特·辛顿是英国皇家学会院士,一位昆虫学界的权威,以对甲虫分类的深入研究闻名,写过几十本专著。

这样一个家族,对后代有一种无言的重量。父亲性格强硬,对子女的要求既有英式老派的严苛,又带着科学家式的绝对冷静。他曾强迫年幼的杰弗里背诵乘法表,背不出来就不许睡觉。在杰弗里眼里,父亲是一座无法撼动的山峰,他毕生都在暗暗较劲又深深敬畏。辛顿后来在不同场合谈到,他从小就有一种感觉:你无论做出什么成就,都不过是家族树上又添一片叶子。他需要一个完全属于自己的领域,一个家族谱系里无人涉足的方向。

在动物和数字之间

辛顿的母亲玛格丽特·克拉克是教师,性格温和。辛顿童年时极其内向,最早的记忆不是在书房,而是在乡下的后院里观察动物。他养过各种爬虫和两栖动物,把它们放进自制的饲养箱,长久蹲在旁边看它们爬行、进食。他后来说,自己最早关于“智能”的直觉,正是来自对动物行为的观察——一只蝾螈怎样判断猎物方位,一条蛇如何判断障碍物——这些朴素的好奇,日后以一种高度抽象的方式,进入了他对神经网络学习规则的研究中。

辛顿曾饲养一条宠物蝮蛇,把蛇养在自己房间的玻璃缸里。母亲对此既害怕又容忍。一位童年朋友后来回忆,去他家做客时,辛顿会平静地打开玻璃缸,让蛇在手臂上爬行,同时毫不间断地解释蛇的感受器官如何工作。那种冷静的专注,与他几十年后在黑板上逐行推导梯度下降方程时如出一辙。

克利夫顿学院的痛苦

七岁那年,辛顿被送到布里斯托尔的克利夫顿学院——一所严格到近乎冷酷的私立寄宿学校。他的父亲和家族里其他男性几乎都曾就读于此。学校实行宗教化的严格纪律,课堂死板,舍监冰冷。辛顿极度不适应。他不是那种在运动场上受欢迎的孩子——身体协调性差,不喜欢对抗,宁愿躲在角落看生物图鉴。

英国寄宿学校有一套残酷的等级秩序:高年级生有权驱使低年级生干活,辛顿因为不善社交,经常被分配去打扫厕所、擦皮鞋。他后来告诉一位采访者:“在那样的环境里,你学会了要么变强,要么找到内心的避难所。”辛顿找到的避难所,是抽象思考。当外界让人失望时,他在心里构建秩序。

剑桥的漫游者

1966年,辛顿进入剑桥大学国王学院。他的学术轨迹在此处变成了一条弯曲的河流——不是笔直向前,而是在不同领域间反复改道。

他最初注册了自然科学,上物理和化学课。但他很快发现,自己痛恨实验。化学实验要求手稳、操作精确,而他的手总是微微发抖——这个细节后来被他自己拿来调侃:“我连滴定管都用不好,怎么可能做实验科学。”于是他转向建筑学,这似乎提供了一个中间地带,既有数学的秩序,又有艺术的自由。他上了一年建筑课,发现自己对结构力学的兴趣远超对美学风格的讨论。

接着他转修哲学,读维特根斯坦、罗素,思考语言和逻辑的边界。但他最终觉得纯哲学太过抽象,缺乏实验性的检验手段。他又转向心理学,尤其是认知心理学,开始关注记忆、知觉和概念形成。

1970年,辛顿获得实验心理学学士学位。但他的毕业证书背后是一份极其凌乱的成绩单——换过四次专业,上过横跨四个学院的课。一位剑桥同期同学后来回忆,那时候的辛顿“极其安静,走路时微微驼背,几乎从不主动发起谈话,但一旦被问到想法,就会给出一个长达半小时的、逻辑缜密到可怕的独白。”

剑桥这几年虽然没有留下任何发表的论文,却塑造了他后来研究风格的关键特征:他不信任任何单一学科的解释。要理解心智,可能需要物理学描述神经元的电活动,化学解释突触间神经递质的释放,信息科学解释信号编码,心理学解释行为表现,甚至哲学审视其中尚未澄清的概念。他在多学科之间穿梭的习惯,正是从这里开始的。

在人工智能的冬天出发

大学毕业后,辛顿做过一段时间的木匠和橱柜制作——这个事实常常被传记作者忽略。他手工并不灵巧,但他在伦敦一间小作坊里待了将近一年,学习刨木头、安装合页。他后来解释,那是他应对学术疲劳的方式:在做木工时,你的成败立即可见,这对一个常年沉浸在抽象问题中的人来说,是一种调节。

1972年,他重新回到学术轨道,进入爱丁堡大学攻读人工智能博士学位。他之所以选择爱丁堡,是因为克里斯托弗·朗盖特-希金斯在那里。朗盖特-希金斯是理论化学家出身,后来转向人工智能,是英国最早研究神经网络的学者之一。辛顿的博士方向从一开始就很明确:用人工神经网络模拟大脑的认知功能。

但问题在于,时代的选择几乎与他的方向彻底相悖。1969年,麻省理工的马文·明斯基和西摩尔·帕珀特出版了《感知机》一书,严格证明了单层感知机的根本局限——连“异或”这么简单的逻辑函数都无法学习。这本书在学术圈产生的影响是摧毁性的。政府削减拨款,期刊退稿率飙升,年轻学者被导师暗示“换方向吧”。到了1972年辛顿进入爱丁堡时,整个领域的温度已经降到了冰点以下。神经网络研究被视为不切实际的幻想,坚持做这个方向的人,大概率会毁掉自己的职业生涯。

导师反目与孤军深入

朗盖特-希金斯本人对辛顿的选择心情复杂。他一方面欣赏这个学生思维的原创性,另一方面也担心他走上一条死路。他鼓励辛顿去做更主流的符号人工智能,但辛顿拒绝了。博士读到中期,两人的关系明显变得紧张。

分歧在辛顿提出一种关于“条状检测神经元”的计算理论时达到了顶点。受神经生理学家休伯尔和威塞尔的经典实验启发,辛顿试图解释大脑视觉皮层中那些只对特定方向边缘做出反应的神经元是如何通过经验被“调谐”出来的。朗盖特-希金斯认为这项工作缺乏严谨的生物学和数学基础。据辛顿后来的回忆,导师曾对另一位同事说:“辛顿要么会做出极其重要的成果,要么会一败涂地,没有中间状态。”

博士论文答辩的前夜,朗盖特-希金斯召集了当时爱丁堡人工智能系几位核心成员,讨论是否应该让辛顿通过答辩。一位在场的年轻讲师后来告诉传记作者,那是一场激烈的辩论:一方认为辛顿的工作缺乏严密的数学框架,另一方认为他提出的问题本身就是重要的——哪怕暂时没有答案。最终,朗盖特-希金斯做出了让步。他让辛顿通过答辩,但两人的师生情谊也在此刻实质性破裂,此后几乎再无往来。

1978年,辛顿获得博士学位。论文题目是《放松及其在视觉中的作用》。论文的核心观点是:视觉系统不仅仅是一个从低到高的前馈处理系统,它内部存在着大量反馈连接,大脑在解释视觉输入时,实际上是在众多可能解释中寻找最“协调”的一种——这个过程很像一个物理系统在能量面上逐步松弛到最低能态。这个观点在当时的认知心理学和神经科学中都属异端,但它埋下了他后来玻尔兹曼机研究的种子。

穷得只剩下信念

博士毕业后的几年,是辛顿物质上最匮乏的时期。他在英国找不到教职——没有大学愿意雇一个专攻“已被证明失败”方向的研究者。他在美国加州大学圣迭戈分校做博士后,与戴维·鲁梅尔哈特和詹姆斯·麦克莱兰等人一起工作。这是一个松散的学术小团体,彼此取暖,被称为“PDP小组”(并行分布式处理小组)。

那几年,辛顿的婚姻也走到了尽头。他的第一任妻子乔安妮是他在剑桥时期认识的,两人有一个儿子和一个女儿。婚姻破裂后,辛顿独自带着两个孩子生活,同时继续研究那个没人看好的方向。他在加州的公寓里一边给孩子做晚饭,一边在餐巾纸上写方程。他的女儿后来回忆,父亲经常在洗碗槽旁边放一叠废纸,一旦有想法就擦干手写几笔。那些纸上留下的,很多后来成了玻尔兹曼机和反向传播算法的最初草图。

Scroll for more