清华教授:应试教育在AI面前全军覆没刘嘉
一、从物理到心理:寻找智能的本质
个人经历:在 AI 与脑科学之间的 20 年
我叫刘嘉,高中时做数理化竞赛,对数理特别感兴趣,准备选择物理作为一辈子的工作方向。但高三时读了弗洛伊德的传记文学《心灵的激情》,我就觉得心理世界比物理世界好玩多了,所以大学选择了学心理学。
去了之后才发现太文科了,所有东西不讲逻辑,太哲学思辨,当时就很失望。后来我就学了计算机,当时叫无线电,现在叫信息系统或自动化。学了这两个之后,当时就很困惑——继续学心理学,还是干脆转行做计算机?
很凑巧碰到了人工神经网络。1994 年左右,有一个老师刚从日本做完博士后回国,在北大开了一门人工神经网络的课程,那应该是我们国内可能第一门人工神经网络的课程。我当时莫名其妙就正好碰上这门课,觉得人工神经网络非常好,很适合我的胃口——既是关于心理世界的,又和我的理科背景比较结合。
MIT 的转折:AI 寒冬中的抉择
我当时就想一定要到 MIT 去做 Marvin Minsky 的学生,他是 AI 的大神。但我不知道他对人工神经网络这么深仇大恨,当时只知道他是 AI 的教主。后来我就到 MIT 去读研究生,没想到当时正好是 AI 的低谷。
Marvin Minsky 本身也对此没有特别大的信心,下一步怎么做他也不知道。对人工神经网络他是一如既往的鄙视,但对于他自己做的符号主义这一块,他自己也很困惑。所以当时他就劝我说,你还是应该去学习脑科学,这块当时正是最火的时候。
所以我后来就留在脑与认知科学系继续做脑科学,我就把 AI 这件事情彻底给忘记了,直到 2015、2016 年。
信仰的回归:《最强大脑》与 AlphaGo 的震撼
2015 年我在北师大当心理学院院长,参与了江苏卫视《最强大脑》制作。当时我们想做一个人机大战,我对 AI 的进展、对人工神经网络、对深度学习了解基本上为零,当时以为 AI 还是一如既往的弱智。
结果没想到节目大赛里面我们做了人脸识别,人工智能在 2016 年的时候已经超越了人类最顶尖的高手,对我触动特别特别大。2016 年正好是 AlphaGo 战胜了李世石,当时也非常出圈。这两件事情结合起来,让我重新回到了 20 年前——信仰回来了,丢失了 20 年的信仰回来了。
其实当时并没有一种底层的信仰,只是觉得这东西很酷,然后自己去学。但一旦大家说这个东西不行,特别是像 Marvin 这种大师说 AI 不行,自己就没细想,然后就放弃掉了。
二、找到底层逻辑:Hinton 的信仰
为什么突然就行了?
2016 年给我的震撼就是:为什么突然一下就行了?我们觉得面孔识别是一个 ill-posed problem,它没有规则,怎么能行呢?为什么 AI 行呢?对我来说触动很大。
我就开始重新看 AI 的书,看了半天其实说实在也没看明白啥。后来我就想应该从 Hinton 的传记史里面入手,但没有一本关于 Hinton 的传记。那我就自己去对 Hinton 的历史做了一个调研,把他的背景看了下。我也去看了 Bengio 和 Yann LeCun,但他们相对 Hinton 来说属于后来之秀,并没有像 Hinton 经历过一系列的周期。
当时我就把 Hinton 的历史研究了一番,把他的历史研究清楚了之后,我觉得我找到了我的底层逻辑。
Hinton 的那句话
Hinton 有一句话,我觉得那句话对我来说是非常非常触动的。别人问他为什么他要坚持做人工神经网络,做这种类似于仿生的这条道路,他说:人的大脑就是这么工作的,没理由人工神经网络不这么工作。
我觉得这句话道出了底层的一个信仰。人工神经网络不是说我是把神经元连起来做一个仿生,而是因为我们人类之所以能够涌现出智能出来,就是因为我们大脑里面有了这种架构——神经元连接起来的这种架构。
他是把这种架构作为 AI 的一个最底层的逻辑。所以在这种架构的底层逻辑,你如果再去深挖,就只有一个东西——就是我们大脑的这种学习能力。你可以把它变成可塑性、可扩展性,但它的本质就是:只要你大脑长成这种样子,你有了神经网络,它这种底层架构就能支撑你的学习。而有了学习,你就有智能。
学习能力与涌现能力
从物理这个层面上来讲,只要有了神经元——这神经元其实就是物理学里面一个小的粒子,这个粒子干不了任何事情,非常简单。但是众多的粒子混在一起,它就有可能涌现。
Hinton 把这句话放出来的时候,其实就谈到了关于人工智能最核心的两点:
第一个学习能力——代表了他可以无限的去拥有新的知识
第二个涌现能力——表明他是没有天花板的
我们人是有天花板的,但是人工智能是没有天花板的。他把这两点讲透了之后,我就立刻就清楚了——当年就应该选人工神经网络来做。至于说你是用 Hopfield 还是用什么东西,那些东西都不重要,那都是一些小的东西。只要你底层架构在这放着了,其他所有问题都是一些技术问题,都是可解决的技术问题。
辞职转向:从行政到研究
找到底层逻辑之后,我第一件事情就是把部长赶紧给辞掉。当时其实如果假设从行政的这个路上来讲的话,其实是一片坦途,因为当时不到 45 岁级别做的比较高,大家还比较认可。但当时就想不能在那上面浪费时间。
所以我就把我的所有的行政职务辞掉,辞掉了之后当一个普通的教授。学校不允许辞职,就是花了一年的时间,每两天给我们大书记发一次短信,说你赶紧批准吧。后来批准了,所以后来我就重新回来做 AI 这一块。
在北师大做,后来发现北师大各方面挺好,但是北师大的 AI 不行,而我自己 AI 也比较弱,基本上是零。所以当时就想要到一个 AI 比较强的地方去做。清华正好也联系我很多次,他们脑科学比较弱,希望我去增强他们脑科学那一块。清华正好他的人工智能比较强,所以 2020 年我就来到清华。
三、智能的本质:学习与涌现
什么是学习?
智能在我来说就两个要素。第一个要素就是学习。以前做符号主义这块,他做的相当于填鸭——我把知识总结出来,然后让 AI 给记住,这不是学习,这就是一种知识库的做法。而人工神经网络干的什么事情呢?就是学习。你只要有新的知识来,我具有这种学习能力,那就够了。
我的理解有两点:
第一点,他一定是具有举一反三的这种能力。就我学习一,我能够推广出去。那么这种推广的意思,它就涉及到一点创造力——我能打破原来的边界。我学了加法,我可能能做乘法,能做除法了。这是我们所说的学习,学习要和推广、举一反三、和创造力、从 0 到 1 这种创造力把它联系起来。
否则我们就变成了记忆。假设你让我学 1+1=2,我可以学会 1+1=2,我也可以把它记下来。但是你记忆 1+1=2,你永远不会做 2×3=6 这件事情,你永远不会做乘法,因为你跳不出加法这个框架。
再举个抽象的例子,比如像塞尚他们去学传统绘画,毕加索学传统绘画,但是他们能跳出这种传统绘画出来,能搞出印象派,能搞出立体主义,0 到 1 的创造东西出来。所以我认为这是学习的本质——我能够从已知走向未知,它学习到里面的底层逻辑,而不是简单的 1+1=2 这种知识。
归纳推理与演绎推理
这背后就涉及到两种推理方式:
第一个,归纳推理。你根据所谓的小样本学习,我给了你些样例,我给你看两张猫的图片,你就根据这样例总结出它下面的一套规则。然后找到它的一个底层逻辑,这一块就是我们刚才所说的我能够举一反三了,这已经是一种学习能力了。以后再给我一张从来没见过的猫,我也知道那叫猫,而不叫狗。
第二个能力,演绎推理。演绎推理就是我找到一个逻辑原点,基于这个逻辑原点然后我往前面走。这就是亚里士多德提出的叫第一性原理。马斯克现在把第一性原理炒的很火,其实第一性原理这个词最早是由亚里士多德提出的,其实就是我们所说的演绎推理——他找到一个逻辑原点,从这逻辑原点往前面走就是了。
爱因斯坦我觉得特别牛的一个地方,他就是始终在找他的逻辑原点。他找到他的逻辑原点,他就可以往前面走。比如说狭义相对论,就说你的光速是我们运动的上限,从这角度往前面推,我能看见什么。他所以说做了很多假想的这种实验。
这种演绎推理,可以看到他就是跟那个天外飞仙一样,你不知道他逻辑原点从哪来的——我就相信他,相信他然后我就从那边走,我就能得到一个结论。绝大多数情况都是一些很疯狂的结论,但有时候他就能够把握住事实的本质,这就是靠人的这种顿悟,这种学习能力。
AI 有演绎能力吗?
从我的观察,从目前来说,我现在还没有看到 AI 具有演绎的能力。至少我们能看见的各种东西,都还在我们人类能够理解的框架之内。爱因斯坦比如说搞出一个广义相对论出来,那就是超越了所有的物理学家的理解的框架之内,他已经是一条新的框架。
AI 我们现在目前来说还没有看到,无论他是解多么复杂的数学问题,无论他写多么复杂的程序,我觉得 AI 现在更多的还是一个归纳推理,或者归纳推理它也不是特别完美,靠的 chain of thoughts 一点点往前面去推。
演绎推理它的核心就是说,一种是我从一个已知逻辑点往前面推。我们解数学题,解这些东西都有,还有比如说我要不要买学区房等等类似,这都是从已有的逻辑原点来。
我说的真正创造力的这种,他是要去找一个全新的逻辑原点,他自己找。这个东西不存在于已知的这种知识框架之内。
逻辑原点的重要性
比如说我们刚才谈到的 Hinton,他的做 AI 的逻辑原点就是:大脑能工作,没有理由我人工神经网络不工作。这是他所有东西的一个逻辑原点,这个逻辑原点是他找到的。
我们现在来理解,你比如说现在让我来推,我没问题。我为什么要做脑科学+AI 的结合?因为我就是从这个逻辑原点出发。但这个逻辑原点不是我找到的,是 Hinton 找到的。所以这就是为什么 Hinton 能够成为人工智能之父,我就是一个小跟班,这就是区别。
所以关键不是在于演绎的动作,而是在于找原点的那个动作。
缺少引路人的一代
我为什么走了 20 年的这么一个弯路?如果假设我当年 94 年、95 年我学到了人工神经网络,我觉得也很不错,但是我就没问自己问题:为什么?它能工作吗?它只是一个技巧吗?还是一个玩具吗?还是一种工具吗?我是没有信仰的。
如果假设我当年就能找到这个逻辑原点——我对人的精神世界非常感兴趣,那么 AI 就是一个工具让我去探索人类的精神世界,我相信人工神经网络能够产生和人一样的精神世界——那我 94、95 年,我就不顾一切的进人工神经网络了。但是没有,我没有这个逻辑原点。
我就是 Marvin 一说这个东西不靠谱,大师说了,大师就是我的逻辑原点,然后我就自然就跑不见了。这就是回到我刚才讲的,我觉得我们人生,刚才说我们中国的教育,我们的人生就缺少一个引路人,逼着我们去找这个原点,引导我们去找这个原点。
因为每个人的道路都是不一样的,有的是比如说造火箭,有的去做神经网络,有的去教书,有的去搞艺术,我觉得都没问题,道路都可以。但是你去做任何一个选择的时候,或者大选择的时候,你需要一个逻辑原点。但是我们从来就没有人引导我们去找这个逻辑原点。
你知道吗,我们都是随波逐流的。我为什么要上北大?因为北大是中国最好的大学,那我就去上北大。我没有去想过其他的原因的。后来去学了心理学,就是偶尔看了一本书。等等你就会发现,你人生是由一个个巧合组成的。那巧合对了呢,你走到今天;巧合错了呢,你可能就死在一个地方,然后来回打转。
但是我们的教育,没有人去逼着大家去想:你的逻辑原点是什么?你的底层逻辑是什么?没有。所以直到到了我这个年龄,我才开始想这个逻辑原点的事情,其实已经很晚了,你已经错过了。
涌现:智能的第二要素
第二个我觉得智能最重要的就是涌现。涌现是什么意思呢?涌现在我们现在人类上面,我们已经看不见了。我们从现代人类上面,你过 100 年,过 1000 年,其实你看不见这个涌现了,因为我们人的大脑它其实已经定下来了,你要再出点新的东西,你是看不到。
但是呢,从猴子变成人,这是一个涌现。我们人有很多很多东西是动物没有的,而这些东西靠的全是涌现。而这个涌现其实就靠一个东西——就是我们的神经元变得越来越复杂,神经元的数量变得越来越多。
就像那个物理学一样,一个粒子两个粒子,你给我谈什么涌现,没有意义,谈涌现完全不存在。只有当他粒子数量增加,它的复杂度增加——记住这一定是两个:数量加复杂度,两个增加,才会有复杂系统,复杂动力系统才会涌现。
智能其实就这两个:
第一个学习,我能不断创造出新的东西出来
第二个,就我能够从智商超越我已有的物种,变成一个全新的物种
涌现这个在目前来说,几千年来人类已经没有涌现了。人的大脑他已经长成这样子了,神经元的复杂度不可能几千年发生变化,我们神经元的数量在几千年之内不可能再有大的变化。所以从这角度讲,涌现这件事情在人身上已经结束了。
人类大脑:进化史上的奇迹
大脑在 300 万年体积增加 3 倍,就是进化史上最大的奇迹。不然的话,我们今天的世界应该就是一个原始的世界,看不到什么科技摩天大楼,完全没有。我们就跟猴子一样,我们就跟猫一样,快快乐乐的来到这个世界,莫名其妙的死掉。这个世界就是一个没有意义的世界。因为我们有了智能,这个世界才有意义。


