一场关于人类心智的千年追问:语言是什么?本征时代
三个令人困惑的问题
让我们从三个看似简单的问题开始。
问题一:语言是人类独有的吗?
你可能听说过非洲灰鹦鹉 Alex 能说英语、理解颜色和数字概念;你可能看过大象通过次声波与远方的同伴"对话";你可能注意到你的宠物狗似乎能听懂你的许多话。然而,动物交流系统与人类语言之间,存在着一条难以逾越的鸿沟。这条鸿沟究竟在哪里?
问题二:语言能力是与生俱来的,还是后天习得的?
一个三岁的孩子,在没有人系统教授语法的情况下,能够自然地掌握母语的所有复杂规则——包括她从未听过的句子。而一个成年人学习外语,往往要付出巨大的努力,却仍然难以达到母语者的水平。这种不对称意味着什么?
问题三:机器能理解语言吗?
2022年,ChatGPT 横空出世,在短短两个月内吸引了1亿月活跃用户。LLM(大语言模型)能够写诗、编程、翻译、通过律师考试——它们似乎真的"理解"了语言。但哲学家 David Chalmers(戴维·查尔默斯)却尖锐地追问:LLM 是否可能有意识?这个问题为何让无数学者夜不能寐?
这三个问题看似各不相同,却指向同一个核心:什么是语言?语言如何运作?语言与心智的关系是什么?
这就是语言学——一门研究人类语言本质的学科——所面对的基本问题。
语言学的核心战场
语言学不像物理学那样有清晰的实验对象,也不像数学那样有明确的公理体系。它处于哲学、认知科学、神经科学、计算机科学的交汇地带,而每个学科都从自己的角度逼近这个古老的问题。
天性还是教养?
19世纪之前,人们普遍相信语言是纯粹的文化产物——婴儿像白纸一样出生,在成长过程中通过模仿和奖励学会了语言。
然而,20世纪50年代,一位年轻的美国语言学家开始质疑这一常识。
Noam Chomsky(诺姆·乔姆斯基)在1957年出版《句法结构》,提出了一个石破天惊的假说:人类大脑天生就包含某种语言获得装置(Language Acquisition Device)。儿童能够从有限的语言输入中快速掌握语法规则,不是因为他们学会了规则,而是因为他们的大脑本来就已经预装了某些普遍语法(Universal Grammar)。
Chomsky 的论据是:如果语言完全靠后天习得,就无法解释儿童为什么能在短短几年内、在充满错误和不完整输入的环境中,迅速掌握如此复杂的系统。更重要的是,儿童说出的许多句子是他们从未听过的——这意味着他们不是在简单地模仿,而是在创造性地应用语法规则。
这一观点引发了长达半个多世纪的争论:语言能力究竟在多大程度上是天生的?
语言与思维:谁决定了谁?
另一个根本问题是:语言与思维的关系是什么?
有一种观点认为,语言只是思想的"外衣"——思维先于语言存在,语言只是用来表达已经形成的思想。正如笛卡尔所言,"我思故我在",思维是不依赖语言的独立存在。
但越来越多的证据指向另一个方向:语言可能在某种程度上塑造了思维本身。
1884年,柏林大学的神经学家卡尔·韦尼克(Carl Wernicke, 1848-1904)发现,失语症患者——大脑语言区域受损的病人——在某些认知任务上表现出困难,尽管他们的"智力"似乎没有受损。这一发现预示了20世纪的一个重大争论。
Benjamin Lee Whorf(本杰明·李·沃尔夫)在1956年提出:语言的结构影响说话者的思维方式。著名的"萨丕尔-沃尔夫假说"认为,不同语言的使用者实际上"看到"了不同的世界。这一假说虽然被后来的研究过度简化,但语言相对性的核心洞见至今仍然具有启发性。
最近,认知科学家 Lera Boroditsky(蕾拉·博罗季茨基)的研究表明,语言如何描述时间和空间,确实会影响说话者的推理方式。例如,习惯用"前后"描述时间(如中文"前天"、"后年")的人,与用"左右"描述时间的人,在时间推理任务上表现出不同的认知策略。
语言的边界:什么不是语言?
语言学还必须回答一个看似简单却极其复杂的问题:语言的边界在哪里?
· 蜜蜂的舞蹈是一种"语言"吗?它们用8字形舞蹈传达花蜜的距离和方向信息。
· 鲸鱼的歌声可以传播数千公里,能够学习和改进——这是语言吗?
· 计算机编程语言有明确的语法规则,能够表达复杂的逻辑——它们是人类语言的延伸,还是完全不同的物种?
· 数学公式语言能够精确描述自然界最深奥的规律——它与自然语言有何本质区别?
这些边界问题不仅仅是分类游戏——它们帮助我们理解语言最核心的特征。
语言哲学:语言是思想的边界,还是世界本身?
还有一个更深层的问题:语言哲学(Philosophy of Language)本身是语言学吗?
20世纪最伟大的哲学家之一路德维希·维特根斯坦(Ludwig Wittgenstein, 1889-1951)在《逻辑哲学论》中写道:"语言的界限就是世界的界限。"(Die Grenzen meiner Sprache sind die Grenzen meiner Welt.)这句话的意思是:我们能够思考和表达的,只能通过语言这个框架。语言不只是表达思想的工具,它本身就是思想可能性的条件。
但这带来一个根本性的困惑:如果语言是世界的框架,那么语言哲学研究的"语言"——这种作为世界框架的语言——还是语言学所研究的自然语言吗?
另一哲学家马丁·海德格尔(Martin Heidegger, 1889-1976)更激进地认为,语言不是人类表达思想的工具,而是语言本身在"说"——人类只是被语言"征用"(sprachet)的话语载体。这意味着语言学研究的"语法"和"结构",可能只是语言"说话"的副产品,而非其本质。
语言哲学关心的不是语法规则或音位系统,而是:语言如何构建了我们所经验的世界?语言与存在的关系是什么?意义从何而来?这些问题的答案,可能永远超出了经验科学的范畴,需要哲学的视角才能触及。
在 Part 14 中,我们将深入这个领域:从弗雷格的"意义与指称",到维特根斯坦的"语言游戏",再到奥斯汀的"言语行为理论"——看看语言哲学家们如何从另一个角度逼近语言的本质。
系列大纲预告
本系列将带你踏上一场跨越2500年的知识探险,从印度古老的语法学传统,到神经科学实验室里对语言大脑机制的探索,最终回答那个最根本的问题:语言如何成为可能?
语言的边界与智能的未来
本系列的核心框架:压缩即智能
在展开具体历史之前,我想介绍一个将贯穿整个系列的核心思想:压缩即智能。
这个思想的现代来源是深度学习先驱 Ray Kurzweil(雷·库兹韦尔)的一个洞见:智能的本质是压缩。如果你能用更少的比特描述一个现象,你就能更好地理解它、预测它、操作它。学习的过程,本质上就是压缩的过程。
语言是智能最强大的压缩工具之一。
让我们来理解这一点。你掌握了几千个英语单词和一套语法规则,但凭借这些有限的工具,你能够表达和理解无限多的思想。你可以描述一个你从未见过的事件,可以构建一个你从未听过的概念,可以理解一个你从未听过的句子。
这是怎么回事?
语言提供了一套组合系统(compositional system)。有限的词汇通过有限的语法规则,可以生成无限多的组合。每个组合都有意义——或者说,语言能够将意义分配给这些组合。
这种组合性(compositionality)是语言的核心特征,也是 Chomsky 语法理论的核心假设。但它同时也是智能和认知的核心特征:在不同领域,智能都表现为从有限的基本元素中生成无限组合的能力。
读完这个系列,你能获得什么?
这不是一门语言学课程。
我们不会花时间记忆音位学(phonology)的术语,也不会深入句法学(syntax)的形式化体系。
我们的目标是回答三个最根本的问题:
1、人类语言能力的本质是什么? 你是如何"知道"你的母语的?这种知识从何而来?
2、语言学思想是如何演进的? 从古代印度的语法学家,到中世纪欧洲的经院哲学家,到20世纪美国的形式主义者,到今天的认知科学家——不同学科背景的人如何塑造了我们对语言的理解?
3、语言学研究的前沿在哪里? 大脑科学、遗传学、人工智能的进展如何改变了语言学的问题意识和研究方法?
这不仅仅是一场知识旅行。语言学的问题——天赋还是习得、语言如何影响思维、机器能否理解语言——同时也是关于人类心智本质的哲学问题。在这个 AI 爆发式发展的时代,理解语言的本质,就是理解我们自身最后的护城河。


