LeCun炮轰Hinton:他就是想摆烂退休量子位

5/18/2026

Lecun这次是真跟Hinton爆了……

Hinton之前从来没特别关注过LLM。结果2023年GPT-4出来,他突然跟顿悟了一样:

“天哪,这些模型已经非常接近人类智能了,它们可能有主观体验……”

对于这种转变,Lecun表示——

完全不认同,难以理解。

我感觉他就是想摆烂:“好了,这就是我们需要的,我可以宣布胜利了。”

“嗯嗯,我可以退休了。然后到处去做关于AI危险的演讲。”

紧接着,话锋一转,又把矛头指向了另一位图灵奖得主。

其实很多事情我早在几年前就说过,Hinton最近才意识到。

Bengio的情况类似。

这也是为什么Lecun在被主持人问到为何如此「另类」时,回答:

从来没有什么我和Hinton和Bengio分道扬镳,是他们变了。

既然要可汗大点兵,当然避免不了聊到老东家。

到了2024年初、尤其是2025年,FAIR已经不符合我认为保持创新、研究和突破所需要的条件了。

很多优秀的人都走了。

至于原因,Lecun说其实扎克伯格很好,领导层也都很支持他。只不过,Meta也卷入LLM竞赛后,实在没办法只顾着埋头做研究了。

对此,Lecun表示很遗憾。

因为在他看来,要获得突破性研究「其实很简单」。

就雇最好的人,这些人有嗅觉,知道该做什么。你给他们成功所需的资源,然后……

滚开,别挡路。

但主持人还是不太满意,一路刨根问底:为什么?为什么?为什么??

重点怀疑对象——亚历山大王。

Scale AI的收购是不是这个纯LLM聚焦的催化剂之一?

LeCun的回答也很实在了,真是问啥说啥。

肯定是的。但我不确定我是否有足够的内部信息来评论。

扎克伯格可能在亚历山大王身上看到了某种接班人的影子,一个更年轻版本的自己。

除了这些,当然也保留了经典节目。

Lecun用带着点调侃的语气,再次向LLM阵营发起了挑衅。

JEPA类世界模型,五年内统治AI圈。(笑)

这是Lecun的最新一期播客专访,他跟主持人聊了快一个半小时,关于世界模型、JEPA、为什么离开Meta、为什么LLM走不到AGI……

好久没有这么逐字逐句地听访谈了,真有点力竭。

全程不敢跳过,全程无尿点,Lecun全程都在疯狂输出暴论:

Anthropic在试图用恐惧来推动AI监管,我完全不认同这种做法。

LLM永远不可能可靠,不是所有事情都是Coding。

模仿学习就是不行,连自动驾驶这一个任务都搞不定。

世界模型希望解决的,是zero-shot解决新任务

如果你在读PhD,别做LLM。没意义,你做不了贡献。

还有少数地方是真的在做研究,比如DeepMind。但整个行业越来越封闭了。

以下附上访谈全文。

为保证可读性,量子位在不改变原意的基础上,对内容做了部分调整。

Enjoy。

为什么LLM不是通往智能的路

主持人:你当年押注神经网络,所有人都在质疑你,结果证明你是对的。

现在你又在做一个类似的事情,押注against LLM和主流的生成式架构。

你最近还围绕这个方向创办了新公司AMI。AMI在做什么?

LeCun:首先我要说清楚,LLM没有什么问题。

LLM是很多非常有用的AI产品的基础,我自己也在用,它们很好,做它们该做的事情。

但LLM不是通往人类水平智能的路径,甚至不是通往动物水平智能的路径。

主持人:你自己还帮着做了最早一批主要的开源LLM。

LeCun:没错。所以AMI是什么?AMI代表Advanced Machine Intelligence,我们的定位是AI for the real world。

今天大家熟知的AI技术,擅长的是语言操作。

语言是很特殊的一种东西,它特别适合目前这些成功的架构。

但现实世界呢?是高维的、连续的、有噪声的、混乱的。难度完全不在一个量级。

这也是我大半个职业生涯在做的事情,过去五六年加速推进,最近两年取得了实质性进展。

到去年年底,很明显Meta已经不是推进这个项目的合适场所了,所以我离开并创办了AMI。

主持人:这似乎是一个行业趋势,越来越多的人从大公司或研究实验室出来,带着自己兴奋的研究方向创业。

LeCun:这确实是一个很奇怪的trade off。

有两种模式。一种是大量探索性研究,很多方向并行。然后某个东西好像work了,你需要继续推进,但它已经不是研究了。

做这些事的人是研究员——至少媒体这么叫他们——但实际上已经变成了工程和产品化。

这种事在Meta发生过好几次。

2023年初,FAIR开发的Llama 1非常有前景,Meta专门创建了Gen AI组织来把它变成真正的产品,后来出了Llama 2、Llama 3、Llama 4。

Llama 4有点令人失望,扎克伯格对此不满意,把整个组织重组了,换了新人。

但过去一年真正发生的事情是,Meta意识到自己落后了,于是把战略重新聚焦到追赶行业上。

副作用就是,大量的探索性研究被降低了优先级。

我做的JEPA和世界模型的工作倒没有受影响,但公司其他部分完全聚焦在LLM上了。

这让我很清楚,Meta不再是推进这个项目的合适地方。

我们有了初步成果,需要从研究转向真正的技术开发、规模化和产品化。

同时我们也意识到,大部分应用场景Meta其实不太感兴趣,比如制造业。

主持人:你在追求世界模型这个大方向。但也有其他人从更偏生成式的角度切入世界模型,比如Google的Genie、各种视频模型,VLA,还有李飞飞做的3D空间模型……你怎么看JEPA模型和这些方法的比较?

LeCun:世界模型正在快速变成一个buzzword,在研究领域已经是了,在工业界也开始了。

VLA我就不多说了。这条路现在普遍被认为走不通了,不够可靠,需要的训练数据太多。

那什么是世界模型?从根本上说,世界模型就是让一个智能体能预测自己行为的后果。

我无法想象你怎么能构建一个agent系统,而这个系统没有预测自己行为后果的能力。如果人类不考虑后果就行动,别人会觉得我们是傻子。

所以世界模型就是这么回事,能够预测你自己行为的后果,你就可以规划一系列行动来完成一个任务、达成一个目标。

通过规划、推理、搜索和优化来做这件事,而不是像LLM那样一个token接一个token地自回归预测。你是在搜索一个能完成任务的最优行动序列。

LLM没有预测自己行为后果的能力,也没有真正的规划能力,因为推理就是预测下一个token,不是搜索。

所以,智能行为需要三个特征。

第一,预测行为后果的能力。

第二,通过优化和搜索来规划的能力,找到能产生正确结果的行动序列。

第三,就是你怎么预测行为的后果。

比如我面前有一个没有盖的水瓶。如果我推瓶子底部,它会在桌上滑动。如果我推瓶子顶部,它可能会翻倒。

但我们无法精确预测瓶子会往哪个方向倒。我们不可能在像素级别预测这些。

我们大脑中的世界模型,预测的是一个抽象层面的表征。

主持人:这个架构的设计,很大程度上是受人脑启发的?

LeCun:至少是受认知科学的启发。能不能直接翻译成一个具体的神经网络架构,这中间有很大的gap。

认知科学确实是一个动机。心理学中的系统二就是这个意思,你在做深思熟虑的、反思性的行为时,会想象、预测自己行为的后果,然后据此规划。跟系统一那种本能的、反应性的行为不同。

所以有灵感来源,但也有大量的实证证据表明,你不应该去生成像素。

我对通过预测来建立世界模型这件事感兴趣很久了。

大约五年前有一个顿悟的时刻,我意识到所有成功学到了好的图像和视频表征的架构,都是非生成式的。

VAE,变分自编码器,或者更广义的自编码器,直觉上似乎是学习输入的抽象表征的自然方式。你把图像输入一个神经网络,训练它在输出端重建输入。

Scroll for more