清华教授：应试教育在AI面前全军覆没刘嘉

一、从物理到心理：寻找智能的本质

个人经历：在 AI 与脑科学之间的 20 年

我叫刘嘉，高中时做数理化竞赛，对数理特别感兴趣，准备选择物理作为一辈子的工作方向。但高三时读了弗洛伊德的传记文学《心灵的激情》，我就觉得心理世界比物理世界好玩多了，所以大学选择了学心理学。

去了之后才发现太文科了，所有东西不讲逻辑，太哲学思辨，当时就很失望。后来我就学了计算机，当时叫无线电，现在叫信息系统或自动化。学了这两个之后，当时就很困惑——继续学心理学，还是干脆转行做计算机？

很凑巧碰到了人工神经网络。1994 年左右，有一个老师刚从日本做完博士后回国，在北大开了一门人工神经网络的课程，那应该是我们国内可能第一门人工神经网络的课程。我当时莫名其妙就正好碰上这门课，觉得人工神经网络非常好，很适合我的胃口——既是关于心理世界的，又和我的理科背景比较结合。

MIT 的转折：AI 寒冬中的抉择

我当时就想一定要到 MIT 去做 Marvin Minsky 的学生，他是 AI 的大神。但我不知道他对人工神经网络这么深仇大恨，当时只知道他是 AI 的教主。后来我就到 MIT 去读研究生，没想到当时正好是 AI 的低谷。

Marvin Minsky 本身也对此没有特别大的信心，下一步怎么做他也不知道。对人工神经网络他是一如既往的鄙视，但对于他自己做的符号主义这一块，他自己也很困惑。所以当时他就劝我说，你还是应该去学习脑科学，这块当时正是最火的时候。

所以我后来就留在脑与认知科学系继续做脑科学，我就把 AI 这件事情彻底给忘记了，直到 2015、2016 年。

信仰的回归：《最强大脑》与 AlphaGo 的震撼

2015 年我在北师大当心理学院院长，参与了江苏卫视《最强大脑》制作。当时我们想做一个人机大战，我对 AI 的进展、对人工神经网络、对深度学习了解基本上为零，当时以为 AI 还是一如既往的弱智。

结果没想到节目大赛里面我们做了人脸识别，人工智能在 2016 年的时候已经超越了人类最顶尖的高手，对我触动特别特别大。2016 年正好是 AlphaGo 战胜了李世石，当时也非常出圈。这两件事情结合起来，让我重新回到了 20 年前——信仰回来了，丢失了 20 年的信仰回来了。

其实当时并没有一种底层的信仰，只是觉得这东西很酷，然后自己去学。但一旦大家说这个东西不行，特别是像 Marvin 这种大师说 AI 不行，自己就没细想，然后就放弃掉了。

二、找到底层逻辑：Hinton 的信仰

为什么突然就行了？

2016 年给我的震撼就是：为什么突然一下就行了？我们觉得面孔识别是一个 ill-posed problem，它没有规则，怎么能行呢？为什么 AI 行呢？对我来说触动很大。

我就开始重新看 AI 的书，看了半天其实说实在也没看明白啥。后来我就想应该从 Hinton 的传记史里面入手，但没有一本关于 Hinton 的传记。那我就自己去对 Hinton 的历史做了一个调研，把他的背景看了下。我也去看了 Bengio 和 Yann LeCun，但他们相对 Hinton 来说属于后来之秀，并没有像 Hinton 经历过一系列的周期。

当时我就把 Hinton 的历史研究了一番，把他的历史研究清楚了之后，我觉得我找到了我的底层逻辑。

Hinton 的那句话

Hinton 有一句话，我觉得那句话对我来说是非常非常触动的。别人问他为什么他要坚持做人工神经网络，做这种类似于仿生的这条道路，他说：人的大脑就是这么工作的，没理由人工神经网络不这么工作。

我觉得这句话道出了底层的一个信仰。人工神经网络不是说我是把神经元连起来做一个仿生，而是因为我们人类之所以能够涌现出智能出来，就是因为我们大脑里面有了这种架构——神经元连接起来的这种架构。

他是把这种架构作为 AI 的一个最底层的逻辑。所以在这种架构的底层逻辑，你如果再去深挖，就只有一个东西——就是我们大脑的这种学习能力。你可以把它变成可塑性、可扩展性，但它的本质就是：只要你大脑长成这种样子，你有了神经网络，它这种底层架构就能支撑你的学习。而有了学习，你就有智能。

学习能力与涌现能力

从物理这个层面上来讲，只要有了神经元——这神经元其实就是物理学里面一个小的粒子，这个粒子干不了任何事情，非常简单。但是众多的粒子混在一起，它就有可能涌现。

Hinton 把这句话放出来的时候，其实就谈到了关于人工智能最核心的两点：

第一个学习能力——代表了他可以无限的去拥有新的知识

第二个涌现能力——表明他是没有天花板的

我们人是有天花板的，但是人工智能是没有天花板的。他把这两点讲透了之后，我就立刻就清楚了——当年就应该选人工神经网络来做。至于说你是用 Hopfield 还是用什么东西，那些东西都不重要，那都是一些小的东西。只要你底层架构在这放着了，其他所有问题都是一些技术问题，都是可解决的技术问题。

辞职转向：从行政到研究

找到底层逻辑之后，我第一件事情就是把部长赶紧给辞掉。当时其实如果假设从行政的这个路上来讲的话，其实是一片坦途，因为当时不到 45 岁级别做的比较高，大家还比较认可。但当时就想不能在那上面浪费时间。

所以我就把我的所有的行政职务辞掉，辞掉了之后当一个普通的教授。学校不允许辞职，就是花了一年的时间，每两天给我们大书记发一次短信，说你赶紧批准吧。后来批准了，所以后来我就重新回来做 AI 这一块。

在北师大做，后来发现北师大各方面挺好，但是北师大的 AI 不行，而我自己 AI 也比较弱，基本上是零。所以当时就想要到一个 AI 比较强的地方去做。清华正好也联系我很多次，他们脑科学比较弱，希望我去增强他们脑科学那一块。清华正好他的人工智能比较强，所以 2020 年我就来到清华。

三、智能的本质：学习与涌现

什么是学习？

智能在我来说就两个要素。第一个要素就是学习。以前做符号主义这块，他做的相当于填鸭——我把知识总结出来，然后让 AI 给记住，这不是学习，这就是一种知识库的做法。而人工神经网络干的什么事情呢？就是学习。你只要有新的知识来，我具有这种学习能力，那就够了。

我的理解有两点：

第一点，他一定是具有举一反三的这种能力。就我学习一，我能够推广出去。那么这种推广的意思，它就涉及到一点创造力——我能打破原来的边界。我学了加法，我可能能做乘法，能做除法了。这是我们所说的学习，学习要和推广、举一反三、和创造力、从 0 到 1 这种创造力把它联系起来。

否则我们就变成了记忆。假设你让我学 1+1=2，我可以学会 1+1=2，我也可以把它记下来。但是你记忆 1+1=2，你永远不会做 2×3=6 这件事情，你永远不会做乘法，因为你跳不出加法这个框架。

再举个抽象的例子，比如像塞尚他们去学传统绘画，毕加索学传统绘画，但是他们能跳出这种传统绘画出来，能搞出印象派，能搞出立体主义，0 到 1 的创造东西出来。所以我认为这是学习的本质——我能够从已知走向未知，它学习到里面的底层逻辑，而不是简单的 1+1=2 这种知识。

归纳推理与演绎推理

这背后就涉及到两种推理方式：

第一个，归纳推理。你根据所谓的小样本学习，我给了你些样例，我给你看两张猫的图片，你就根据这样例总结出它下面的一套规则。然后找到它的一个底层逻辑，这一块就是我们刚才所说的我能够举一反三了，这已经是一种学习能力了。以后再给我一张从来没见过的猫，我也知道那叫猫，而不叫狗。

第二个能力，演绎推理。演绎推理就是我找到一个逻辑原点，基于这个逻辑原点然后我往前面走。这就是亚里士多德提出的叫第一性原理。马斯克现在把第一性原理炒的很火，其实第一性原理这个词最早是由亚里士多德提出的，其实就是我们所说的演绎推理——他找到一个逻辑原点，从这逻辑原点往前面走就是了。

爱因斯坦我觉得特别牛的一个地方，他就是始终在找他的逻辑原点。他找到他的逻辑原点，他就可以往前面走。比如说狭义相对论，就说你的光速是我们运动的上限，从这角度往前面推，我能看见什么。他所以说做了很多假想的这种实验。

这种演绎推理，可以看到他就是跟那个天外飞仙一样，你不知道他逻辑原点从哪来的——我就相信他，相信他然后我就从那边走，我就能得到一个结论。绝大多数情况都是一些很疯狂的结论，但有时候他就能够把握住事实的本质，这就是靠人的这种顿悟，这种学习能力。

AI 有演绎能力吗？

从我的观察，从目前来说，我现在还没有看到 AI 具有演绎的能力。至少我们能看见的各种东西，都还在我们人类能够理解的框架之内。爱因斯坦比如说搞出一个广义相对论出来，那就是超越了所有的物理学家的理解的框架之内，他已经是一条新的框架。

AI 我们现在目前来说还没有看到，无论他是解多么复杂的数学问题，无论他写多么复杂的程序，我觉得 AI 现在更多的还是一个归纳推理，或者归纳推理它也不是特别完美，靠的 chain of thoughts 一点点往前面去推。

演绎推理它的核心就是说，一种是我从一个已知逻辑点往前面推。我们解数学题，解这些东西都有，还有比如说我要不要买学区房等等类似，这都是从已有的逻辑原点来。

我说的真正创造力的这种，他是要去找一个全新的逻辑原点，他自己找。这个东西不存在于已知的这种知识框架之内。

逻辑原点的重要性

比如说我们刚才谈到的 Hinton，他的做 AI 的逻辑原点就是：大脑能工作，没有理由我人工神经网络不工作。这是他所有东西的一个逻辑原点，这个逻辑原点是他找到的。

我们现在来理解，你比如说现在让我来推，我没问题。我为什么要做脑科学+AI 的结合？因为我就是从这个逻辑原点出发。但这个逻辑原点不是我找到的，是 Hinton 找到的。所以这就是为什么 Hinton 能够成为人工智能之父，我就是一个小跟班，这就是区别。

所以关键不是在于演绎的动作，而是在于找原点的那个动作。

缺少引路人的一代

我为什么走了 20 年的这么一个弯路？如果假设我当年 94 年、95 年我学到了人工神经网络，我觉得也很不错，但是我就没问自己问题：为什么？它能工作吗？它只是一个技巧吗？还是一个玩具吗？还是一种工具吗？我是没有信仰的。

如果假设我当年就能找到这个逻辑原点——我对人的精神世界非常感兴趣，那么 AI 就是一个工具让我去探索人类的精神世界，我相信人工神经网络能够产生和人一样的精神世界——那我 94、95 年，我就不顾一切的进人工神经网络了。但是没有，我没有这个逻辑原点。

我就是 Marvin 一说这个东西不靠谱，大师说了，大师就是我的逻辑原点，然后我就自然就跑不见了。这就是回到我刚才讲的，我觉得我们人生，刚才说我们中国的教育，我们的人生就缺少一个引路人，逼着我们去找这个原点，引导我们去找这个原点。

因为每个人的道路都是不一样的，有的是比如说造火箭，有的去做神经网络，有的去教书，有的去搞艺术，我觉得都没问题，道路都可以。但是你去做任何一个选择的时候，或者大选择的时候，你需要一个逻辑原点。但是我们从来就没有人引导我们去找这个逻辑原点。

你知道吗，我们都是随波逐流的。我为什么要上北大？因为北大是中国最好的大学，那我就去上北大。我没有去想过其他的原因的。后来去学了心理学，就是偶尔看了一本书。等等你就会发现，你人生是由一个个巧合组成的。那巧合对了呢，你走到今天；巧合错了呢，你可能就死在一个地方，然后来回打转。

但是我们的教育，没有人去逼着大家去想：你的逻辑原点是什么？你的底层逻辑是什么？没有。所以直到到了我这个年龄，我才开始想这个逻辑原点的事情，其实已经很晚了，你已经错过了。

涌现：智能的第二要素

第二个我觉得智能最重要的就是涌现。涌现是什么意思呢？涌现在我们现在人类上面，我们已经看不见了。我们从现代人类上面，你过 100 年，过 1000 年，其实你看不见这个涌现了，因为我们人的大脑它其实已经定下来了，你要再出点新的东西，你是看不到。

但是呢，从猴子变成人，这是一个涌现。我们人有很多很多东西是动物没有的，而这些东西靠的全是涌现。而这个涌现其实就靠一个东西——就是我们的神经元变得越来越复杂，神经元的数量变得越来越多。

就像那个物理学一样，一个粒子两个粒子，你给我谈什么涌现，没有意义，谈涌现完全不存在。只有当他粒子数量增加，它的复杂度增加——记住这一定是两个：数量加复杂度，两个增加，才会有复杂系统，复杂动力系统才会涌现。

智能其实就这两个：

第一个学习，我能不断创造出新的东西出来

第二个，就我能够从智商超越我已有的物种，变成一个全新的物种

涌现这个在目前来说，几千年来人类已经没有涌现了。人的大脑他已经长成这样子了，神经元的复杂度不可能几千年发生变化，我们神经元的数量在几千年之内不可能再有大的变化。所以从这角度讲，涌现这件事情在人身上已经结束了。

人类大脑：进化史上的奇迹

大脑在 300 万年体积增加 3 倍，就是进化史上最大的奇迹。不然的话，我们今天的世界应该就是一个原始的世界，看不到什么科技摩天大楼，完全没有。我们就跟猴子一样，我们就跟猫一样，快快乐乐的来到这个世界，莫名其妙的死掉。这个世界就是一个没有意义的世界。因为我们有了智能，这个世界才有意义。