LeCun炮轰上司不懂行,实锤Llama 4刷榜丑闻新智元
图灵奖大佬LeCun离职Meta后直接开怼:实锤Llama4造假传闻,炮轰原上司Alexandr Wang「不懂科研」,称Meta冲刺「超级智能」完全是被大模型洗脑。同时,他也透露自己的新公司即将在今年发布全新世界模型。
LeCun离开Meta后,直接掀桌了。
刚刚,这位图灵奖得主、Meta前首席科学家一离职,便回头投下了重磅炸弹!
图灵奖得主、Meta前首席科学家Yann LeCun
先是曝出Meta的Llama 4刷榜黑料:
Llama 4测试「被做了点手脚」,团队在不同基准上用不同模型,只为了拿到更好成绩。
紧接着,他又把矛头对准自己原上司:28岁的Alexandr Wang。
他是扎克伯格140亿美元重点押注超级智能的核心人物。
Meta曾向Scale AI投资140亿美元,并将其创始人Alexandr Wang挖来领导「超级智能实验室」。
但LeCun对他的评价,几乎相当于当众拆台:「他没有研究经验,也不知道如何进行研究。」
他认为Alexandr Wang并不真正理解科研,不知道科研人员「喜欢什么、不喜欢什么」,因此预言Meta AI将会有更多员工离职。
炮轰28岁上司 ,预言新一轮离职潮
扎克伯格之所以重金引入Alexandr Wang等人组建「超级智能实验室」,是因为被逼急了。
ChatGPT引爆浪潮后,也让Meta陷入了一场手忙脚乱的应对。
扎克伯格决定把筹码押在Llama大模型上,并重组组织架构,成立生成式 AI(GenAI)部门,要求加速把研究变为产品。
在这个过程中LeCun坚持开源,让Llama 2以「开放权重」成为开源大模型的标杆,甚至被他称为「分水岭」。
扎克伯格决定给GenAI更大压力,认为要加速AI的开发与部署,如果按照原有的方法搞,很可能就会落后。
特别是在去年4月,当Llama 4翻车,公司还被指控「刷榜」,扎克伯格的情绪彻底炸裂。
LeCun称「马克非常沮丧,基本上对所有参与此事的人都失去了信心……所以基本上把整个GenAI组织边缘化了。」
Meta首席AI官、超级实验室领导者Alexandr Wang
于是,Alexandr Wang被推到台前,成了Meta新AI赌注的领军者。
可LeCun对这位年轻上司的不足却直言不讳:认为他年轻、缺乏经验。
他学得很快,知道自己不知道什么……但他没有科研经验,不知道如何进行科研,也不知道科研人员会喜欢什么或不喜欢什么。
当被问起怎么会接受自己的上级突然变成一个28岁的人时,LeCun表示他习惯和年轻人共事。
当时Facebook的工程师平均年龄27岁,他的年龄是他们的两倍。
但他同时也提到Alexandr Wang并没有指挥自己做事:
你不能告诉研究人员该怎么做。你当然不能告诉像我这样的研究人员该怎么做。
意思很明显:研究这件事,不是组织架构图上的任命所能够命令和约束的,而且外行不能指导内行。
Llama 4风波 一次基准测试引爆组织内斗
2025年4月发布的Llama 4翻车后,Meta被指控操纵基准测试成绩。
这次是LeCun首次站出来实锤外界以往的猜测,他指出团队为了美化数据,对基准测试结果进行了「捏造(Fudged)」,「篡改」了部分测试结果。
他还特意指出,在不同基准上用了不同模型,以获得更好成绩。
对扎克伯格来说,这比一次技术失败更难接受。
这一丑闻也直接导致他对原AI团队失去信心,转而重金挖角,开始组建超级智能实验室团队。
Meta开始在人才争夺战里下重注,甚至还因为试图用1亿美元签约奖金挖人上过头条。
激进的人才战略,也导致了整个GenAI组织被边缘化,以及新旧团队、研究与产品、开源与商业之间的结构性摩擦。
由此,也带来了Meta内部一波波的离职潮和裁员潮。
路线之争 LeCun坚持LLM 是条「死路」
真正让LeCun最难忍受的,并不是他口中「不懂管理的上级」,或者是刷榜事件,而是他认为Meta正在集体沉迷于一条错误的方向!
LeCun直言,那批公司为了冲刺新一轮「超级智能」而招来的人「完全被大语言模型洗脑了(completely LLM-pilled)」。
虽然,扎克伯格仍然支持他对AI未来的看法,但公司的大规模招聘主要集中在LLM开发上。
但LeCun的立场是:LLM虽然有用,但从根源上受限,语言本身就是束缚。
要实现人类水平智能,必须理解物理世界的运作方式。
因此,他才会抛出那个让所有大模型路线的追随者们感到「刺耳」的观点:
我确信Meta公司里很多人,包括Alex在内,都不希望我告诉世人,LLM在超级智能领域基本上是一条死路。
然后他拒绝为此妥协:
我不会因为某些人认为我错了就改变我的想法。我没错。作为一名科学家,我的职业操守不允许我这样做。
在一家公司里,你可以跟同事、上司甚至老板争论。
但如果公开挑战组织方向,站出来说「这条路基本是死路」,你就会变成一个天然的异类。
这正像LeCun自己所承认的那样:留下来在「政治上」变得很难。
他在Meta的位置,已经不再适合继续做他想做的研究。
离开是不可避免的结局。
世界模型下一代新范式
LeCun的新公司叫Advanced Machine Intelligence Labs(AMI Labs),专注于用世界模型实现ASI。
V-JEPA世界模型给AI装个「脑内物理沙盒」
LeCun想做的V-JEPA世界模型,可以理解为:让AI不是只会「说得像」,而是能在脑子里搭一个粗粒度的世界模拟器——看见一段视频后,知道哪些东西是物体、它们怎么动、接下来可能发生什么,甚至为行动做准备。
JEPA的关键不抠像素细节,预测「抽象状态」
传统生成式训练常逼模型还原每个像素/词。
JEPA的思路更「务实」:把世界压缩成一串表示(embedding),训练目标是从可见的上下文去预测被遮住部分的表示,而不是把遮住的区域逐像素画回去。
I-JEPA论文把这称为non-generative的自监督学习路径。
V-JEPA把JEPA从图片升级到视频 学「运动规律」
V-JEPA就是视频版JEPA:把视频切成时空块,遮住一部分,让模型用剩下的内容去预测「被遮住那块在表示空间里应该长什么样」。
直觉上,它更容易学到「谁在动、怎么动、动的规则」,而不是纠结纹理噪点。
V-JEPA 2从「看懂」走向「能规划」
V-JEPA 2的路线很明确:
先用超过100万小时互联网视频做大规模自监督预训练;
再用少量机器人交互轨迹,让模型学会「如果我这么做(动作),世界会怎么变」,从而更接近可用于预测与规划的世界模型。
AMI Labs需攻坚的难点
想做好世界模型,有三大难点:
其一是长时程预测,越往后未来分叉越多。
其二是不确定性,同一个场景可能有多种合理下一步。
其三是从表征到行动,学到「状态」还要能服务决策与控制。
而AMI Labs,正是LeCun为了攻克世界模型的难题而成立。
LeCun的新计划
去年11月,当媒体曝出LeCun即将离职Meta,开启新创业计划的消息后,他的日程表就一直处在疯狂状态。
他直言,这个决定使自己的日程表被迫加速了,居于日程表核心位置的,就是去做他口中更接近下一代AI的东西:世界模型(world model)。
LeCun的新创公司AMI Labs总部位于巴黎。
据LeCun称,马克龙还向他发了一条WhatsApp,暗示对他的新创业计划会与法国保持紧密联系感到高兴。
AMI Labs将由法国医疗AI初创公司Nabla的联合创始人兼CEO Alex LeBrun领导,LeCun担任执行主席。
提到这样的安排,LeCun坦诚表示自己当不了CEO:
我是科学家,我挺擅长判断什么技术行得通、什么行不通。但我当不了CEO,一方面我太不擅长组织管理了,另一方面我也太老了!


