“图灵测试”的哲学争论及历史地位中国历史评论

20世纪计算机科学和认知科学的发展，在一定程度上已经将人类思维的哲学争论转变为科学探索。这种范式的转变很大程度上得益于计算机与人脑的类比。作为这一范式转变的结果，人工智能这门学科应运而生。阿兰·图灵（Alan Turing）1950年发表的《计算机器与智能》一文通常被认为是人工智能兴起的标志。在这篇文章中，图灵提出了著名的“图灵测试”方案，这个方案不仅给人类智能提供了一个可操作的定义，同时通过“模拟游戏”的方式将“机器能否思考”这个问题呈现在人们面前。

本文的主要目的是在解读图灵这篇经典文献的基础上，对60年来有关图灵测试的哲学争论作一番较为系统的梳理。文章的前两节分别阐述何谓图灵测试，以及图灵本人对该测试方案可能遇到的反对意见所作的辩驳。第3节重点讨论半个多世纪以来哲学界对图灵测试的诘难与辩护。第4节考察人工智能学界关于图灵测试历史地位的争论。

一、图灵测试方案

1950年，图灵在《计算机器与智能》的开篇就提出了一个令人类深思的问题：“机器能够思考吗（can machines think）？”图灵认为，关于机器是否能思考的争论之所以难以解决，是由于我们没有一个关于“机器”（machine）和“思考”（think）的明确定义。他指出，用常规方法定义是“危险的”和“荒唐的”，为此，图灵设计了一种实验的方法来判定机器是否能够思考，或机器是否具有智能，试图为机器能不能思考的争论双方提供一种判决准则。图灵的目的是找到一个与之相关的问题来解决此问题，并且用“没有歧义的语言来表达”。这个方法就是著名的“图灵测试”。

图灵测试起源于图灵设计的一个模拟游戏。游戏由三个人来做，一个男人（A）,一个女人（B），还有一个提问者（C），性别不限。提问者待在一间与另两人分开的房子里。提问者在游戏中的目标是，确定另外两人哪一个是男性，哪一个是女性。他以标号X和Y称呼他们，在游戏结束时，他可能说“X是A，Y是B”，也可能说“X是B，Y是A”。提问者C可以向A和B提出这样的问题：

C:X，请你告诉我你的头发长度，可以吗？

假定X实际上是A，那么A必须做出回答。A在游戏中的目标是，尽量使C做出错误判断。于是，他可能回答说：“我的头发是瓦盖式的短发，长的一束大约长9英寸。”

为了不让提问者从声调中得到帮助，这些回答应当写出来，若能打印出来则更好。理想的安排是，两间房子之间用一台电传打印机进行交流。也可以用一个中介人来重复提问和回答。第三个游戏参与者（B）的目标是帮助提问者。对她来说，好的策略或许就是如实回答。她在回答时可以加上这样的话：“我是女性，别听他的！”不过这种做法未必真能奏效，因为那个男士也可以运用同样的方式。

图灵测试的核心是询问：“如果这个游戏中用一台机器代替A，会出现什么情况？”在这种情况下做游戏时，提问者做出错误判断的次数和他同一个男人和一个女人做这一游戏时一样多吗？图灵认为，如果询问者无法判断另一个屋子里面是人还是机器，那么屋子里的机器就可以称得上是有智能的，这台机器是可以思考的。图灵还认为，这种模拟游戏的问答方法原则上适用于人类心智的任何领域。

图灵测试的重要特征首先在于它给出了一个可操作的智能定义，也就是根据对一系列特定问题的反应来决定一个客体是否是智能体，这就为判断智能提供了一个客观标准，从而避免了有关智能本质的无谓争论。其二，这项实验使我们免于受到目前无法回答的问题的牵制，比如计算机的内部处理方法是否已知，以及机器是否意识到其本身的动作等等。其三，由于询问者只关注回答问题的内容，这样就消除了偏爱于生物体的设置。

二、图灵本人的辩驳

图灵测试貌似一个简单的模拟游戏，然而其背后所蕴含的思想极为深刻。在《计算机器与智能》一文中，图灵首先从7个方面探讨了机器能否思考这个问题，包括智能计算机特点、机器智能的评判标准和智能计算机器的学习能力。作为一位严谨的思想家，图灵还设想了“图灵测试”可能遇到的9个方面的反对意见，包括神学方面、数学方面和心理学方面的反对意见，并且逐一进行了辩驳。下面我们就具体考察一下图灵的辩驳。

1.神学上的反对意见

思考是人类不朽灵魂的一种机能。上帝把不朽的灵魂给了每个男人和女人，而没有给任何其他动物和机器。所以任何动物和机器都不能思考。

图灵认为，这是神学家的观点，他们把人类中心论的观点强加给了上帝，认为上帝对于人类给予了更高级别的优惠，只能把心灵赋予人类。对于这种论点，图灵采用了神学家的一贯论证方式进行了反驳：既然上帝是全能的，那么就不应当否认他能把心灵赋予任何事物甚至大象的能力；人类不应当用不虔诚的心态来限制上帝赋予任何事物以灵魂的能力。神学家坚持错误观点的例子在科学史上屡见不鲜。比如，神学家一度相信地球是宇宙的中心，而哥白尼却证实了地球围绕太阳旋转。

2.“把头埋在沙里”的反对意见

机器思考的后果太可怕了，我们希望并且相信机器做不到这一点。

图灵认为，这种观点是赤裸裸的人类中心论。这种人类优越论的信念在知识阶层中特别普遍。他们认为思考对于他们来说更重要，更是人类不可剥夺的权利，觉得自己比其他生物或机器有优越性，不愿意承认、甚至不敢相信其他事物也具备思考的能力。图灵用胆小懦弱来形容这类人的品质，因为“该论点根本没有多大价值，不值得反驳，给一点安慰可能更恰当些”。

3.数学上的反对意见

数理逻辑的许多结果都可以用来证明：离散状态机器的能力是有限度的。这些结果中最著名的就是所谓的哥德尔定理，它表明，在任何适度丰富的逻辑系统中都可以形成一些陈述，它们在系统内部既不能被证明，也不能被证伪，除非是这种情况：系统本身不一致。……这一结果认为存在着这种机器做不到的某些事情。

图灵认为，这个反对意见的核心思想是机器本身是一个符号化的形式系统，既然如此，机器必然要陷入“哥德尔陷阱”，但对于人类而言却可以辨别出这类陷阱，即人类可以辨别机器内部那些不能被证明或证伪的命题是真的。

图灵反驳说：“虽然已经能够证明一台特定的机器有这种能力的缺陷，但没有证据能够表明，人类的智能没有这种能力的缺陷。”对于计算机而言，计算机是可操作的，都以某种程序输入，而这种程序就是一个形式系统，按照哥德尔定理，任何内容适度丰富的无矛盾的形式系统都是不完全的，因此计算机的功能是不完全的，而且本质上是不完全的。但图灵认为，计算机做不到的，人类也一样做不到，因为人类所建立的形式系统也是不完全的，所以人类并不比计算机优越。

4.有关意识的反对意见

按这种观点的极端的版本，确认一台机器能否思考的唯一办法就是变成这台机器，并感受到自己在思考。

图灵认为，这个反对意见实际上是“唯我论”的观点。图灵反驳道：“如果得知一个人能否思考的惟一方法就是变成这个特定的人，……那么思想交流便会发生困难。A倾向于认为‘A会思考，而B不会思考’，B却认为‘B会思考，而A不会思考’”。如此一来，人类之间的任何感觉和感受的交流都无法进行。出于对人类现实生活的尊重，我们还是认为人类可以交流，并且都可以思考。

5.有关能力缺陷的反对意见

就算你真的能够让一台机器完成你提到的所有那些事情，但是你绝不可能让一台机器做到X。这里X的特征很多，下面只是一部分：要仁慈、机智、漂亮、友好，有首创精神，有幽默感，能辨别是非，会犯错误，会坠入情网，爱吃草莓冰激凌……

图灵认为这个反对意见实际上建立在科学归纳法的原理上。因为人类还没有看到能够做这些事情的机器，所以就认为机器永远也不可能做到这些事情。图灵反驳道，尽管目前人类看到的机器又粗又笨，并且功能单一、目标有限，但对此人类不能下结论说机器只能有这样的简单功能，当计算机科学发展到一定阶段，人类自然可以看到具有X功能的机器。“对于这些批评机器不可能有丰富多彩的行为的说法，等于在说机器不可能有丰富的存储容量。……这些都有可能在不久的将来实现，而不是乌托邦式的梦想。”

6.洛夫莱斯夫人的反对意见

洛夫莱斯夫人在回忆录中写道：“分析机（Analytical Engine）无权说它创造出什么新的东西。它所能做的都是那些我们知道怎样命令它去执行的事情。”……洛夫莱斯夫人反对意见的另一种说法是，机器“从来不能做任何全新的事情”。……这种反对意见还有一种较好的说法：机器永远不会“使我们出乎意料”。

图灵反驳道，洛夫莱斯夫人只看到了一种特定分析机的特性，这种分析机只能按照既定的程序完成特定的任务，并不能根据复杂情况随机做出变化，她所了解的分析机并未使她相信其他的机器可以具有这些“创新”的特性。为此，图灵提出了“学习机器”的思想。图灵认为，既然直接编制成年人心灵（adult mind）的计算机程序困难较大，我们可以先试图编制模拟儿童心灵的程序。这个儿童心灵程序还需要和教育过程程序密切相关，这样就模拟了人类心灵成长的过程。它的初始状态比较简单，通过教育过程使它逐步达到相对复杂的成人思维。在教育过程中程序不但可以设计随机单元，而且程序还可以利用惩罚和奖励的因素调整人类智能行为的结果。在这种情况下，虽然人类在一定程度上能够预言计算机器的智能行为，但由于智能程序本身的随机性和变化特征，人类就无法预言其准确的行为结果，这样的智能程序给人类带来“惊喜”就是必然的，计算机器的行为结果将会“出乎人类意料”。

7.有关神经系统连续性的反对意见

神经系统肯定不是一台离散状态的机器。神经脉冲刺激神经元时，输入脉冲信号的微小偏差就可能造成输出脉冲大小的巨大变化。可以认为，如果这样，就不能指望用离散状态系统模仿神经系统的行为。

图灵承认，离散状态机与连续状态机肯定有所不同。但图灵论证道，即使他们有所不同，也并不影响模仿游戏的顺利进行，因为询问者根本无法从电传打印机输出的符号中辨认出离散状态机与连续状态机。这样的话，这两种机器的差异对于图灵测试毫无影响。

8.有关人类行为的非形式特征的反对意见

通过建立一组规则来说明一个人在所有情况下应该做什么，是无法办到的。

图灵将这个论点转述为：“如果每个人都有一套确定的制约他的生活的指导规则，人就并不比一台机器更强；但这样的规则是不存在的，所以人不可能是机器。”这个论点的核心是说，人的行为与机器的行为有本质的不同，机器也就无法模拟人的行为，更不能模拟人的思考，因此模仿游戏是无意义的。

对于该论点的反驳，图灵首先说明，我们应该区分人类行为中的“指导规则”（rules of conduct）和“行为规律”（laws of behavior）。“指导规则”是人们可以根据它来行动、也能意识到它的存在的规则，例如“看到红灯就停车”这样的条例；“行为规律”指的是人体中所表现出的自然规律，例如“你掐一下他，他就会尖叫”。图灵指出：“我们不能像认为完备的指导规则不存在一样，就简单地认为完备的行为规律也不存在。就我们所知，发现这种规律的惟一方法就是科学观察。”

因此，图灵得出结论，这种关于人类行为的非形式特征的假设是不成立的，也是未经证实的。诚然，我们还没有充分掌握人类的行为规律，但不能就此下结论说这样的规律不存在。只要我们承认“行为规律”之存在，我们就有能科学观察来发现它。一旦我们掌握了人类的行为规律，人类行为与机器行为之间的本质区别也就消失了。

9.有关超感知的反对意见

这个论点的核心是，如果模仿游戏中的询问者有所谓的超感官知觉，例如心灵感应、透视眼、预知未来、远距离致动等，那么任何事情都可能发生，这必然导致模仿游戏无效。如果超感知存在的话，图灵认为确实任何情况都有可能发生。此时进行图灵测试，就必须设计一种“超感功能屏蔽室”。