LeCun炮轰上司不懂行,实锤Llama 4刷榜丑闻新智元

1/3/2026

图灵奖大佬LeCun离职Meta后直接开怼:实锤Llama4造假传闻,炮轰原上司Alexandr Wang「不懂科研」,称Meta冲刺「超级智能」完全是被大模型洗脑。同时,他也透露自己的新公司即将在今年发布全新世界模型。

LeCun离开Meta后,直接掀桌了。

刚刚,这位图灵奖得主、Meta前首席科学家一离职,便回头投下了重磅炸弹!

图灵奖得主、Meta前首席科学家Yann LeCun

先是曝出Meta的Llama 4刷榜黑料:

Llama 4测试「被做了点手脚」,团队在不同基准上用不同模型,只为了拿到更好成绩。

紧接着,他又把矛头对准自己原上司:28岁的Alexandr Wang。

他是扎克伯格140亿美元重点押注超级智能的核心人物。

Meta曾向Scale AI投资140亿美元,并将其创始人Alexandr Wang挖来领导「超级智能实验室」。

但LeCun对他的评价,几乎相当于当众拆台:「他没有研究经验,也不知道如何进行研究。」

他认为Alexandr Wang并不真正理解科研,不知道科研人员「喜欢什么、不喜欢什么」,因此预言Meta AI将会有更多员工离职。

炮轰28岁上司 ,预言新一轮离职潮

扎克伯格之所以重金引入Alexandr Wang等人组建「超级智能实验室」,是因为被逼急了。

ChatGPT引爆浪潮后,也让Meta陷入了一场手忙脚乱的应对。

扎克伯格决定把筹码押在Llama大模型上,并重组组织架构,成立生成式 AI(GenAI)部门,要求加速把研究变为产品。

在这个过程中LeCun坚持开源,让Llama 2以「开放权重」成为开源大模型的标杆,甚至被他称为「分水岭」。

扎克伯格决定给GenAI更大压力,认为要加速AI的开发与部署,如果按照原有的方法搞,很可能就会落后。

特别是在去年4月,当Llama 4翻车,公司还被指控「刷榜」,扎克伯格的情绪彻底炸裂。

LeCun称「马克非常沮丧,基本上对所有参与此事的人都失去了信心……所以基本上把整个GenAI组织边缘化了。」

Meta首席AI官、超级实验室领导者Alexandr Wang

于是,Alexandr Wang被推到台前,成了Meta新AI赌注的领军者。

可LeCun对这位年轻上司的不足却直言不讳:认为他年轻、缺乏经验。

他学得很快,知道自己不知道什么……但他没有科研经验,不知道如何进行科研,也不知道科研人员会喜欢什么或不喜欢什么。

当被问起怎么会接受自己的上级突然变成一个28岁的人时,LeCun表示他习惯和年轻人共事。

当时Facebook的工程师平均年龄27岁,他的年龄是他们的两倍。

但他同时也提到Alexandr Wang并没有指挥自己做事:

你不能告诉研究人员该怎么做。你当然不能告诉像我这样的研究人员该怎么做。

意思很明显:研究这件事,不是组织架构图上的任命所能够命令和约束的,而且外行不能指导内行。

Llama 4风波 一次基准测试引爆组织内斗

2025年4月发布的Llama 4翻车后,Meta被指控操纵基准测试成绩。

这次是LeCun首次站出来实锤外界以往的猜测,他指出团队为了美化数据,对基准测试结果进行了「捏造(Fudged)」,「篡改」了部分测试结果。

他还特意指出,在不同基准上用了不同模型,以获得更好成绩。

对扎克伯格来说,这比一次技术失败更难接受。

这一丑闻也直接导致他对原AI团队失去信心,转而重金挖角,开始组建超级智能实验室团队。

Meta开始在人才争夺战里下重注,甚至还因为试图用1亿美元签约奖金挖人上过头条。

激进的人才战略,也导致了整个GenAI组织被边缘化,以及新旧团队、研究与产品、开源与商业之间的结构性摩擦。

由此,也带来了Meta内部一波波的离职潮和裁员潮。

路线之争 LeCun坚持LLM 是条「死路」

真正让LeCun最难忍受的,并不是他口中「不懂管理的上级」,或者是刷榜事件,而是他认为Meta正在集体沉迷于一条错误的方向!

LeCun直言,那批公司为了冲刺新一轮「超级智能」而招来的人「完全被大语言模型洗脑了(completely LLM-pilled)」。

虽然,扎克伯格仍然支持他对AI未来的看法,但公司的大规模招聘主要集中在LLM开发上。

但LeCun的立场是:LLM虽然有用,但从根源上受限,语言本身就是束缚。

要实现人类水平智能,必须理解物理世界的运作方式。

因此,他才会抛出那个让所有大模型路线的追随者们感到「刺耳」的观点:

我确信Meta公司里很多人,包括Alex在内,都不希望我告诉世人,LLM在超级智能领域基本上是一条死路。

然后他拒绝为此妥协:

我不会因为某些人认为我错了就改变我的想法。我没错。作为一名科学家,我的职业操守不允许我这样做。

在一家公司里,你可以跟同事、上司甚至老板争论。

但如果公开挑战组织方向,站出来说「这条路基本是死路」,你就会变成一个天然的异类。

这正像LeCun自己所承认的那样:留下来在「政治上」变得很难。

他在Meta的位置,已经不再适合继续做他想做的研究。

离开是不可避免的结局。

世界模型下一代新范式

LeCun的新公司叫Advanced Machine Intelligence Labs(AMI Labs),专注于用世界模型实现ASI。

V-JEPA世界模型给AI装个「脑内物理沙盒」

LeCun想做的V-JEPA世界模型,可以理解为:让AI不是只会「说得像」,而是能在脑子里搭一个粗粒度的世界模拟器——看见一段视频后,知道哪些东西是物体、它们怎么动、接下来可能发生什么,甚至为行动做准备。

JEPA的关键不抠像素细节,预测「抽象状态」

传统生成式训练常逼模型还原每个像素/词。

JEPA的思路更「务实」:把世界压缩成一串表示(embedding),训练目标是从可见的上下文去预测被遮住部分的表示,而不是把遮住的区域逐像素画回去。

I-JEPA论文把这称为non-generative的自监督学习路径。

V-JEPA把JEPA从图片升级到视频 学「运动规律」

V-JEPA就是视频版JEPA:把视频切成时空块,遮住一部分,让模型用剩下的内容去预测「被遮住那块在表示空间里应该长什么样」。

直觉上,它更容易学到「谁在动、怎么动、动的规则」,而不是纠结纹理噪点。

V-JEPA 2从「看懂」走向「能规划」

V-JEPA 2的路线很明确:

先用超过100万小时互联网视频做大规模自监督预训练;

再用少量机器人交互轨迹,让模型学会「如果我这么做(动作),世界会怎么变」,从而更接近可用于预测与规划的世界模型。

AMI Labs需攻坚的难点

想做好世界模型,有三大难点:

其一是长时程预测,越往后未来分叉越多。

其二是不确定性,同一个场景可能有多种合理下一步。

其三是从表征到行动,学到「状态」还要能服务决策与控制。

而AMI Labs,正是LeCun为了攻克世界模型的难题而成立。

LeCun的新计划

去年11月,当媒体曝出LeCun即将离职Meta,开启新创业计划的消息后,他的日程表就一直处在疯狂状态。

他直言,这个决定使自己的日程表被迫加速了,居于日程表核心位置的,就是去做他口中更接近下一代AI的东西:世界模型(world model)。

LeCun的新创公司AMI Labs总部位于巴黎。

据LeCun称,马克龙还向他发了一条WhatsApp,暗示对他的新创业计划会与法国保持紧密联系感到高兴。

AMI Labs将由法国医疗AI初创公司Nabla的联合创始人兼CEO Alex LeBrun领导,LeCun担任执行主席。

提到这样的安排,LeCun坦诚表示自己当不了CEO:

我是科学家,我挺擅长判断什么技术行得通、什么行不通。但我当不了CEO,一方面我太不擅长组织管理了,另一方面我也太老了!

Scroll for more