机器学习之父:Hinton等正在伤害年轻一代机器之心
他是教出 Andrew Ng、Yoshua Bengio 的那个人,他亲历了机器学习从无名到主宰世界的全过程。而现在,他说 —— 这场对话让他最担心的,是「思想领袖们」正在伤害年轻一代。
如果要评选过去半个世纪对人工智能影响最深的学者,Michael I. Jordan 几乎无法被绕开。
2016 年,《科学》杂志将他列为「全球最具影响力的计算机科学家」。他是统计机器学习领域的奠基人之一,在图模型、变分推断、贝叶斯非参数方法等核心方向上留下了大量引用极高的基础性工作。他目前是加州大学伯克利分校电气工程与计算机科学系、统计系双聘的杰出教授,同时在法国 Inria 巴黎分部任职研究员。
更广为人知的,是他的学生名单。Andrew Ng(吴恩达),深度学习教育的全球推广者;Yoshua Bengio,深度学习三巨头之一、图灵奖得主;Zoubin Ghahramani,贝叶斯机器学习领军人物;Eric Xing,MBZUAI 校长、知名 AI 研究者;David Blei,主题模型 LDA 的核心发明人……Jordan 的门下,走出了一整代机器学习领域的重要建设者。
这次接受采访的节目是 MLST(Machine Learning Street Talk),主持人 Tim Scarfe 是一位长期关注 AI 前沿的播客人。
访谈围绕 Jordan 去年发布在 arXiv 上的论文《AI 的集体主义经济学视角》(A Collectivist, Economic Perspective on AI)展开,但谈话的射程远不止于此 —— 涉及 AGI 炒作、硅谷思维的缺陷、数据市场的经济设计、不确定性量化,以及他对 Hinton 等「旧友们」转型为末日预言家的真实看法。
强化学习领域的奠基人 Richard Sutton 推荐了这个访谈,认为 Jordan 带来了一个有力而深思熟虑的视角。
以下是这场对话的主要内容。
「AGI 只是个公关词」:
我从来不认为自己是 AI 研究者
访谈一开场,Jordan 便亮明了立场,毫不拖泥带水。
「AGI 对我来说只是个公关词。它是一种扭曲。它让人困惑,尤其让年轻人困惑。」
他解释,「人工智能」这个词本身就有历史包袱。1950 年代 John McCarthy 等人提出这个概念时,背后有一套特定的方法论预设 —— 逻辑推理、符号系统。那套路径后来并没有真正走通。真正在工业界产生巨大影响的,是在那之后几十年里,从统计学、运筹学等领域慢慢生长出来的机器学习方法:决策树、最近邻、逻辑回归、隐马尔可夫模型…… 这些方法大多数压根不是从「AI」这个圈子里发展出来的
「亚马逊的云计算,最初就是为了处理机器学习的工作负载而建的。供应链、金融、交通运输系统,都在大规模使用机器学习,直到今天也是。这才是我成长于其中的传统。」
然后大约五年前,「AI」这个词随着大语言模型的兴起卷土重来。原因很简单:这次模型的输出是人类读得懂的流畅语言,而不再只是预测供应链、商业、价格之类的东西。人们看到这个就觉得:「天哪,我们解决了那个古老的 AI 问题!」Jordan 说,如果把「AI 问题」的定义窄化到图灵测试,那勉强算是。但这不过是换了个输出格式,背后的机器学习传统一直都在。
「这种 AI 术语回归,对研究路径产生了扭曲效应,对我们如何思考商业模式也产生了扭曲效应。还不够,他们还得再造一个更宏大的流行词 ——AGI。」
但他真正想批评的,不只是词本身,而是这套词背后的思维定势。他说,那些自称 AI 研究者的人,往往其实没有一个清晰的目标。他们的逻辑是:人类是智能的,大脑是一台计算机,只要我们模仿它、放大它,好事就会自然发生 —— 然后就停在这里了。没有「我们要解决社会上的什么具体问题」,没有「这对谁有价值、以什么方式产生价值」,只有一个隐隐约约的「它会帮我们解决问题,然后大家就幸福了」。
「这就是硅谷的谈话方式。我离开那里,部分原因就是我厌倦了这种谈话。那里没有什么深度的长期思考。它变成了一场内卷赛,一场金钱竞赛。」
Jordan 说,他从来没有把自己当作 AI 研究者,他也从来没有读过一本 AI 的书。他的训练背景是统计学家和认知科学家。「但我乐于接受这个称谓,」他笑说。
「我们是社会动物」:
为什么 AI 需要经济学?
Jordan 提出这篇新论文的核心观点时,先反问了一个问题:当前很多 AI 研究者真正想实现的目标,到底是什么?
在他看来,今天相当一部分 AI 叙事背后,仍然是一个非常旧的想法:人类是智能的,大脑像一台计算机;只要我们模仿它、放大它、并行化它,它自然就会做出伟大的事情。问题是,话往往就停在这里了。
它没有进一步回答:我们究竟要解决社会中的什么问题?这项技术为谁创造价值?成本由谁承担?收益又如何分配?它只是隐含着一种期待:技术会替我们解决问题,然后人类就会幸福。
在 Jordan 看来,这不是严肃的工程思维,而是在用隐喻代替系统设计。
主持人随后提出了一个典型的硅谷式反驳:如果像 Ilya Sutskever 这样的硅谷 AI 领袖认为,只要把 LLM 组织成多智能体系统,经济学里的那些复杂性就会自然涌现,Jordan 会怎么看?
Jordan 的回答毫不客气:「这就好像 1940 年代的化学工程师说,我们把一堆东西扔在一起,让它自己工作就好了。你确实可以这么做,但你会得到很多在经济上根本不可行的东西,还会伤害很多人。」
他认为,这一代 AI 建设者缺少的,不是智力,也不是代码能力,而是概念和思想的深度。他说,每一个上一个时代的工程学科 —— 电气、化学、机械 —— 不光有能动手的人,背后都有一套基础方程支撑:麦克斯韦方程组,牛顿定律。「现在这个领域有什么?只有非常聪明、会编程、有很多直觉的人 —— 我从没感受到任何真正智识深度的东西。感觉就像科幻小说。」
更让他担心的是,已经有人被伤害了,但没有人在谈这件事。Facebook 损害了大量青少年的心理健康,这从来没有被计算机科学家认真讨论过。现在又来了新一轮的「就业岗位可能会消失,但没关系,新的会出来,一直都是这样」——「我不喜欢这种说话方式。」
那么,Jordan 自己的框架是什么?他用了一个他反复强调的词:集体主义(collectivist)。
「当前这些技术,输入来自数十亿人,也将服务数十亿人。所以它本来就是一个集体性的东西 —— 有一个集体在输入,有一个集体在接受输出。这背后其实有一张巨大的、潜在的网络。」
但主流 AI 思维的根本缺陷在于,始终把智能窄化为了个体认知。把人类大脑当成模板,把神经元和梯度下降当成核心隐喻,却忽略了一个最基本的事实:人类是社会动物,我们大量的智识来自聚合 —— 聚合观点、思想,形成文化,文化在时间上保存它们。
更重要的是,社会为我们的智识提供了语境。在这个语境里聪明的行动,换一个语境可能就是蠢的。智能本身高度情境化,也高度依赖当下。
所谓语境,就是外面可能有人正在试图利用我,也可能有人想和我合作,而我并不真正知道对方的意图。所以我必须试探,必须发出信号,必须设计一些机制,让我们能够有效互动。经济学正是以一种数学化的方式研究这些问题。
这让他得出结论:如果不引入经济学和社会科学,我们就根本没有在讨论「完整的智能」。
他的框架最终落在三个顶点组成的三角形上:计算机科学(算法、抽象与模块化)、统计学(推断与不确定性量化)、经济学(激励机制与博弈均衡)。
「计算思维教会你模块化、抽象和 API—— 这是 Jeannette Wing 几十年前就提出的洞见,我完全认同。但大量算法其实不是从计算机科学原则里来的,它们来自统计学的推断思维:在不确定性下如何收集数据、如何做预测。再加上经济思维:周围有其他主体,如何确保激励机制是正确的。」
他说,只有计算加优化,你就只能得到语言模型。把统计和经济思维加进来,你才开始有一个完整的系统性思考框架。「我把这叫做这个时代的新文科核心。我的人文学科同事可能不同意 —— 但我认为,人文学科目前还没有触及这个时代真正核心的智识问题。」
「别问它是否理解」:
停止人类化机器
Jordan 在整个访谈里有一个反复出现的动作:每当对话滑向「AI 是否真正理解」「模型是否拥有某种内在认知」这类问题,他都会把问题拉回到更具体的层面。
「我们根本不需要去问这个问题。」
他回忆起 2000 年前后第一次去亚马逊时看到的景象。那时,亚马逊已经在用大规模机器学习方法 —— 当时叫随机森林 —— 处理供应链建模。系统能预测哪艘船会在印度洋延误,某些零件会不会准时到达,整个供应链每天把数十亿件商品送到一亿人手里。没有任何人类能理解那个大盒子里在发生什么。
「但这重要吗?不重要。你要问的不是它是否『理解』物流,而是:它能不能降低不确定性,能不能让工程系统建立在它之上,能不能让计划成为可能。这才是你要问的。」
他认为,「理解」「智能」这些词,是给媒体用的。媒体喜欢这些词,因为它们容易传播,也容易制造想象。而那些把 AGI、AI 术语推出去的人,他们心里很清楚,在自己的研究工作里根本不需要这些词 —— 他们只是知道媒体会接住。
「我们在自己的研究里根本不在乎『理解』这个词是否成立。我们想做的是建造好的系统。」
主持人提到,他上周刚采访了 AlphaFold 的核心研究者 John Jumper,问对方 AlphaFold 是否在某种意义上「理解」蛋白质。Jumper 的回答是:对这个词过敏。他说得很清楚 ——AlphaFold 让我们能预测,让我们能控制,但理解这个动作必须由人类自己来做,不能外包给机器。
这正中 Jordan 的观点。「为什么要说它理解?说它预测、它降低不确定性、它让实验成为可能 —— 这些已经足够惊人了。非得加上『理解』这个词,只会招来错误的期待,然后招来错误的失望。」
他认为,「人类化」机器这件事之所以有害,不只是因为不准确,更因为它会系统性地转移注意力。一旦你开始问「它是否理解」,就很容易忘记真正重要的工程问题:它在什么条件下会失效?它在哪些问题上最不可靠?它有没有给出误差范围?它如何与真实数据结合?它应该被嵌入什么样的系统?又该由谁来承担它出错的后果?
这些问题,才是真正决定 AI 能否进入现实世界的关键。
「那是媒体的问题,不是研究者的问题,我们不需要那个词。」
基础模型最危险的地方
恰恰是科学家最需要它的地方
Jordan 说他很钦佩 AlphaFold。他明确区分:AlphaFold 不像 LLM,它是针对一组特定问题设计的,并且在这些问题上做得极好。但他和团队做过一项分析,发现了一个让他真正担忧的盲点。
他们想研究一个假设:蛋白质中的量子涨落,是否与磷酸化存在关联。也就是说,那些结构上看起来「有点问题」的蛋白质,是否反而在细胞里更活跃?这是一个 2×2 的统计检验:磷酸化(是 / 否)× 量子涨落(有 / 无)。
用传统的已知晶体结构数据来做这个检验,样本量太小,根本没有足够的统计功效去拒绝原假设。换成 AlphaFold 预测的两亿个蛋白质结构,功效大幅提升,原假设被拒绝了 —— 看起来是好事。
「但我们发现,那个统计量的置信区间极其狭窄,而且整个区间都偏离了真实值很远。不只是在这一个问题上 —— 我们在一个领域接一个领域地发现了同样的现象。」
原因并不难理解:AlphaFold 的训练集里,含有量子涨落特征的蛋白质本来就很少,因为这个方向过去研究得不多,而且晶体化本身很难。训练数据稀少,就意味着 AlphaFold 在这个具体问题上的预测可能高度偏倚 —— 但它不告诉你这一点。它照样给出答案,照样看起来很有把握,但置信区间很窄,答案并没有真正覆盖真实值。


