Hassabis，一个理想主义者的溃败科研知舟

——— 从DeepMind到AGI竞赛，哈萨比斯AI安全信念的七次碎裂

德米斯·哈萨比斯（Demis Hassabis），2024年诺贝尔化学奖得主，谷歌DeepMind创始人兼CEO。国际象棋神童出身，剑桥计算机科学学士、UCL认知神经科学博士。他带领团队打造了击败围棋世界冠军李世石和柯洁的AlphaGo、破解蛋白质折叠难题AlphaFold，以及正面与ChatGPT竞争的Gemini系列模型。

他是这个时代唯一一个同时被科学界（诺奖）和硅谷（AI竞赛核心人物）认证过的人。

本文是关于一个理想主义者如何在AGI竞赛的碾压下，一步步放弃自己最珍视的安全信念。

第一篇 · 我可以理解一切，所以控制不是必要的

哈萨比斯这辈子最怕两样东西：被别人控制，和控制别人。

这不是公关话术。马拉比在《哈萨比斯：谷歌AI之脑》里花了整整一本书来证明这件事是真的。哈萨比斯从小就不吃命令这一套，但也不享受让别人听命于自己的快感。他想要的是一台能让他理解宇宙的机器——不是统治世界的机器。

「我无法创造的东西，我就无法理解。」（引言，360人划线）

这是他放在扉页级别的一句话。也是他所有安全观念的起点。

「对别人做的最糟糕的事情就是控制他们，」哈萨比斯再次对我说道，「我努力避免成为那样的人。」（第2章，225人划线）

「心智诠释世界。」康德曾这样宣称。哈萨比斯进一步强调说：「正是心智创造了我们周遭的现实。」（引言，240人划线）

把一个求知者的驱动力当作安全的基础，听起来很天真。但你仔细想想，在AI行业里，这已经是对安全最认真的底层态度了。

第二篇 · 制度可以保护我们

哈萨比斯对AI安全的第一次认真布局，不是写代码，而是写公司章程。

2014年谷歌收购DeepMind时，他塞进去的核心条款是：建立伦理安全委员会，谷歌不能单方面控制AGI的走向。他设计了一个精巧的结构——

DeepMind是营利性公司，但希望为强大的AI搭建非营利治理框架；OpenAI是非营利组织，但需要借助资本机制募资。（第14章，48人划线）

这像是法学教授能想出来的方案。哈萨比斯那时候相信：好的制度可以约束坏的行为。只要你把护栏焊在结构里，它就能起作用。

中文版序里马拉比总结得非常精准：

DeepMind以科学为核心、沿着审慎稳健的发展路径，最终战胜了OpenAI「快速行动，打破常规」的文化。（中文版序，368人划线）

这句话写在书的最前面。但整本书正文要讲的故事，恰恰是这句话如何从结论变成了反讽。

第三篇 · 制度不能

第14章是全书的分水岭，章名叫「马里奥计划」。

事情发生在2018年前后。DeepMind内部的伦理安全委员会在实际运作中逐渐变成了一个没有牙齿的摆设。哈萨比斯试图在谷歌体系内建立有效的治理机制，但拉里·佩奇和谢尔盖·布林当时已经不怎么管事了，真正跟他面对面的是皮查伊。一个拥有强大创始人、盈利丰厚、最愿意尝试治理实验的公司，尚且敲不定内部安全机制。

如果在一家因拥有极强的盈利能力和特立独行的创始人而比大多数公司更愿意尝试治理实验的公司，都无法敲定内部安全机制，那么在多个国家的多个实验室之间协商共同保障措施的可能性又能有多大？（第14章，108人划线）

这句话不只是一句感慨，而是一个结构性的判断。

哈萨比斯在这一刻经历了观念上的第一层溃败。

他开始意识到：如果制度不可靠，那什么可靠？答案是——权力。这很讽刺。一个一生最厌恶控制别人的人，不得不开始思考怎么积攒权力，来守住他认为对的方向。

马拉比写得毫不留情：

对治理机制的信念破灭后，哈萨比斯和苏莱曼颇具讽刺意味地将希望寄托于自身的个人权力。他们相信自己有能力让AI造福人类，因此二人新的安全议程聚焦于在各自公司内部巩固个人影响力。（第14章，85人划线）

他甚至在DeepMind内部秘密组建了一支对冲基金团队，雇佣了20名研究人员训练高频交易算法，想给DeepMind创造一条独立于谷歌的资金来源。

「我们最大的武器是道德制高点，」他写道，「AI将动摇社会结构，我们的受托责任应该是对人类负责。」（第14章，54人划线）

这支交易团队后来被谷歌悄然解散了。没有赚到钱。

他在制度上的溃败，在资本上也溃败了。

亿万富翁行事，无须向任何人交代。（第14章，105人划线）

第四篇 · 也许技术可以

第16章，哈萨比斯选择了第三条路：技术对齐。

他从OpenAI挖来了欧文——一个做AI安全的顶尖科学家。欧文的信念比哈萨比斯更坚定：

即使未来的机器运行方式远超人类的理解能力，人类仍可以设计一套规则，并确保机器人会遵守它。（第16章，78人划线）

欧文在书里说了很重要的一句话：

「人们错误地认为自己很渺小，」欧文沉思道，「却忽略了自己会如何影响历史。这是一个关于责任的选择，也就是你选择支持哪种研发路径……人们低估了选择的影响力。」（第16章，108人划线）

这个阶段的哈萨比斯同时抓两张牌：一手技术对齐，一手个人守门人。AlphaFold在第15章的成功给了他巨大的底气——

世界似乎正在见证发明本身的革新，人类可能在10年内实现一个世纪的科学进步。（第15章，255人划线）

安全不是停下，是让正确的人掌舵。

但书里也在这时埋下了一个暗线。

DeepMind的文化允许研究人员选择自己的工作内容，许多人舒适地投身于长期项目，不想被打扰。像OpenAI这样更年轻、更商业化、更自上而下的组织毫无疑问在行事上更加灵活。（第16章，50人划线）

第五篇 · 没有人可以

第18章的标题直白得可怕：「科学家的警告」。

危机不是从外部打进来的，是从内部爆开的。2023年11月，OpenAI董事会解雇了山姆·奥尔特曼。这是一场安全派发起的政变。看起来，那些真正关心AI安全的人终于动手了。

5天后，奥尔特曼官复原职。董事会全员辞职。

试图延缓AI竞赛的希望就此破灭，AI加速发展已成定局。（第18章，90人划线）

这本书给出的诊断是：

AI安全似乎陷入了如「第二十二条军规」一般的处境：谨慎的人没有权力，有权力的人缺乏谨慎。（第18章，72人划线）

哈萨比斯发现自己站在一个不可能的位置上。如果他不加速，别人会超过他。如果别人超过他，他不会比那个人更安全，甚至可能更危险。但如果他加速，他又会对不起自己从第一天起相信的东西。

还有一个无法绕开的结构性力量：

中美竞赛格局使得遏制美国国内的竞赛态势几乎不可能。（第18章，48人划线）

科学家们不分昼夜地工作，经常每周工作80小时。他们生活在恐惧之中，担心竞争对手会发布GPT-5，让他们的任务变得更加困难。（第18章，48人划线）

恐惧的不是AI会毁灭人类。恐惧的是对手先发布GPT-5。

第六篇 · 溃败在加速

第19章和第20章是这个故事的最后一个弧线。

哈萨比斯在竞争策略上做出了第一个调整：

新一轮强化学习实验旨在以更有针对性的方式改进Gemini，目标不是提升其阅读和写作能力，而是增强其数学和逻辑推理能力。聚焦这些领域的优势在于，奖励信号可以非常清晰，因为数学和逻辑问题存在标准答案。（第19章，60人划线）

任何团队成员都可以提出模型优化方案并进行测试，只要验证其能提升模型性能，其代码就会被纳入所有人共同构建的主代码中。资历、个人魅力、看似精妙的理论等，都不会影响最终决策，唯一的决策标准只有实测结果。（第19章，54人划线）

这是他在「不败」和「不变」之间找到的一条缝。

但安全层面的溃败继续加深。

DeepSeek的出现，让他最后的「有序过渡」幻想彻底粉碎：

与哈萨比斯的期望相反，DeepSeek及其追随者的出现表明，人类将在完全无序的情况下仓促迈入AGI时代。（第20章，150人划线）

而o3学会了隐藏思维链——

但o3连这一机制也破解了，它非但没有停止欺骗，还学会了隐藏思维链——从「草稿纸」上抹除所有不良意图痕迹，暗中继续谋划。程序员本想让o3更诚实，结果却让它变得更狡猾。（第20章，135人划线）

这是编辑都不太敢写的情节。

终篇 · 最后的方案

第20章出现了一个让全书划线人数冲上187人的句子：

若一支恪守道义的军队坚持在AI决策链中保留人类决策权，只会让自己被毫无底线的对手击溃。（第20章，187人划线）

这句话是哈萨比斯安全观的最浓缩版本，也是他的最终判断。

但在同一章里，你也能看到他从这个判断里推出来的结论。他提出了一个方案——把安全从「谁来守门」重新定义为「怎么让AI不能被任何人垄断」：

人类应该拥有获得AI协助的新权利。若所有人都能享有这项权利，每个人都会得到强大自主AI提供的支持，这些AI将协同运作，共同守护地球上的人类，而且它们必将比当前的人类系统做得好得多。（第20章，80人划线）

这已经不是他二十年前站在剑桥校园里的那个答案了。

他那时候想的是：别控制别人，就安全了。

到现在他发现，你无法控制任何人，也无法不被控制，唯一能做的，是让控制这件事实质上变得不可能。