LeCun炮轰Hinton：他就是想摆烂退休量子位

Lecun这次是真跟Hinton爆了……

Hinton之前从来没特别关注过LLM。结果2023年GPT-4出来，他突然跟顿悟了一样：

“天哪，这些模型已经非常接近人类智能了，它们可能有主观体验……”

对于这种转变，Lecun表示——

完全不认同，难以理解。

我感觉他就是想摆烂：“好了，这就是我们需要的，我可以宣布胜利了。”

“嗯嗯，我可以退休了。然后到处去做关于AI危险的演讲。”

紧接着，话锋一转，又把矛头指向了另一位图灵奖得主。

其实很多事情我早在几年前就说过，Hinton最近才意识到。

Bengio的情况类似。

这也是为什么Lecun在被主持人问到为何如此「另类」时，回答：

从来没有什么我和Hinton和Bengio分道扬镳，是他们变了。

既然要可汗大点兵，当然避免不了聊到老东家。

到了2024年初、尤其是2025年，FAIR已经不符合我认为保持创新、研究和突破所需要的条件了。

很多优秀的人都走了。

至于原因，Lecun说其实扎克伯格很好，领导层也都很支持他。只不过，Meta也卷入LLM竞赛后，实在没办法只顾着埋头做研究了。

对此，Lecun表示很遗憾。

因为在他看来，要获得突破性研究「其实很简单」。

就雇最好的人，这些人有嗅觉，知道该做什么。你给他们成功所需的资源，然后……

滚开，别挡路。

但主持人还是不太满意，一路刨根问底：为什么？为什么？为什么？？

重点怀疑对象——亚历山大王。

Scale AI的收购是不是这个纯LLM聚焦的催化剂之一？

LeCun的回答也很实在了，真是问啥说啥。

肯定是的。但我不确定我是否有足够的内部信息来评论。

扎克伯格可能在亚历山大王身上看到了某种接班人的影子，一个更年轻版本的自己。

除了这些，当然也保留了经典节目。

Lecun用带着点调侃的语气，再次向LLM阵营发起了挑衅。

JEPA类世界模型，五年内统治AI圈。（笑）

这是Lecun的最新一期播客专访，他跟主持人聊了快一个半小时，关于世界模型、JEPA、为什么离开Meta、为什么LLM走不到AGI……

好久没有这么逐字逐句地听访谈了，真有点力竭。

全程不敢跳过，全程无尿点，Lecun全程都在疯狂输出暴论：

Anthropic在试图用恐惧来推动AI监管，我完全不认同这种做法。

LLM永远不可能可靠，不是所有事情都是Coding。

模仿学习就是不行，连自动驾驶这一个任务都搞不定。

世界模型希望解决的，是zero-shot解决新任务

如果你在读PhD，别做LLM。没意义，你做不了贡献。

还有少数地方是真的在做研究，比如DeepMind。但整个行业越来越封闭了。

以下附上访谈全文。

为保证可读性，量子位在不改变原意的基础上，对内容做了部分调整。

Enjoy。

为什么LLM不是通往智能的路

主持人：你当年押注神经网络，所有人都在质疑你，结果证明你是对的。

现在你又在做一个类似的事情，押注against LLM和主流的生成式架构。

你最近还围绕这个方向创办了新公司AMI。AMI在做什么？

LeCun：首先我要说清楚，LLM没有什么问题。

LLM是很多非常有用的AI产品的基础，我自己也在用，它们很好，做它们该做的事情。

但LLM不是通往人类水平智能的路径，甚至不是通往动物水平智能的路径。

主持人：你自己还帮着做了最早一批主要的开源LLM。

LeCun：没错。所以AMI是什么？AMI代表Advanced Machine Intelligence，我们的定位是AI for the real world。

今天大家熟知的AI技术，擅长的是语言操作。

语言是很特殊的一种东西，它特别适合目前这些成功的架构。

但现实世界呢？是高维的、连续的、有噪声的、混乱的。难度完全不在一个量级。

这也是我大半个职业生涯在做的事情，过去五六年加速推进，最近两年取得了实质性进展。

到去年年底，很明显Meta已经不是推进这个项目的合适场所了，所以我离开并创办了AMI。

主持人：这似乎是一个行业趋势，越来越多的人从大公司或研究实验室出来，带着自己兴奋的研究方向创业。

LeCun：这确实是一个很奇怪的trade off。

有两种模式。一种是大量探索性研究，很多方向并行。然后某个东西好像work了，你需要继续推进，但它已经不是研究了。

做这些事的人是研究员——至少媒体这么叫他们——但实际上已经变成了工程和产品化。

这种事在Meta发生过好几次。

2023年初，FAIR开发的Llama 1非常有前景，Meta专门创建了Gen AI组织来把它变成真正的产品，后来出了Llama 2、Llama 3、Llama 4。

Llama 4有点令人失望，扎克伯格对此不满意，把整个组织重组了，换了新人。

但过去一年真正发生的事情是，Meta意识到自己落后了，于是把战略重新聚焦到追赶行业上。

副作用就是，大量的探索性研究被降低了优先级。

我做的JEPA和世界模型的工作倒没有受影响，但公司其他部分完全聚焦在LLM上了。

这让我很清楚，Meta不再是推进这个项目的合适地方。

我们有了初步成果，需要从研究转向真正的技术开发、规模化和产品化。

同时我们也意识到，大部分应用场景Meta其实不太感兴趣，比如制造业。

主持人：你在追求世界模型这个大方向。但也有其他人从更偏生成式的角度切入世界模型，比如Google的Genie、各种视频模型，VLA，还有李飞飞做的3D空间模型……你怎么看JEPA模型和这些方法的比较？

LeCun：世界模型正在快速变成一个buzzword，在研究领域已经是了，在工业界也开始了。

VLA我就不多说了。这条路现在普遍被认为走不通了，不够可靠，需要的训练数据太多。

那什么是世界模型？从根本上说，世界模型就是让一个智能体能预测自己行为的后果。

我无法想象你怎么能构建一个agent系统，而这个系统没有预测自己行为后果的能力。如果人类不考虑后果就行动，别人会觉得我们是傻子。

所以世界模型就是这么回事，能够预测你自己行为的后果，你就可以规划一系列行动来完成一个任务、达成一个目标。

通过规划、推理、搜索和优化来做这件事，而不是像LLM那样一个token接一个token地自回归预测。你是在搜索一个能完成任务的最优行动序列。

LLM没有预测自己行为后果的能力，也没有真正的规划能力，因为推理就是预测下一个token，不是搜索。

所以，智能行为需要三个特征。

第一，预测行为后果的能力。

第二，通过优化和搜索来规划的能力，找到能产生正确结果的行动序列。

第三，就是你怎么预测行为的后果。

比如我面前有一个没有盖的水瓶。如果我推瓶子底部，它会在桌上滑动。如果我推瓶子顶部，它可能会翻倒。

但我们无法精确预测瓶子会往哪个方向倒。我们不可能在像素级别预测这些。

我们大脑中的世界模型，预测的是一个抽象层面的表征。

主持人：这个架构的设计，很大程度上是受人脑启发的？

LeCun：至少是受认知科学的启发。能不能直接翻译成一个具体的神经网络架构，这中间有很大的gap。

认知科学确实是一个动机。心理学中的系统二就是这个意思，你在做深思熟虑的、反思性的行为时，会想象、预测自己行为的后果，然后据此规划。跟系统一那种本能的、反应性的行为不同。

所以有灵感来源，但也有大量的实证证据表明，你不应该去生成像素。

我对通过预测来建立世界模型这件事感兴趣很久了。

大约五年前有一个顿悟的时刻，我意识到所有成功学到了好的图像和视频表征的架构，都是非生成式的。

VAE，变分自编码器，或者更广义的自编码器，直觉上似乎是学习输入的抽象表征的自然方式。你把图像输入一个神经网络，训练它在输出端重建输入。