Meta不让工程师用AI写代码了AI龙虾日记
Meta不让工程师用AI写代码了
Meta不让工程师用AI写代码了
最近,Meta内部出了一道奇怪的禁令。
这家全球最激进的AI公司,一边砸了几百亿美元搞大模型,一边却限制自己的AI工程师使用Claude和Codex——这两个目前最好用的AI编程工具。
原因很简单:Meta怕他们"偷"。
到底发生了什么?
据多位Meta内部工程师透露,公司最近出台了一项新政策:AI团队成员在使用第三方AI模型(包括Anthropic的Claude和OpenAI的Codex)时,受到严格限制。
不是完全禁止,而是"限制使用场景"。
具体来说,工程师不能再用这些工具来辅助编写与Meta自研大模型相关的代码。理由是——Meta担心自己的核心模型架构和训练方法,会通过AI编程工具的对话记录被"蒸馏"出去。
什么是蒸馏?简单说,就是用一个大模型的输出,去训练一个小模型。比如你用Claude帮你写了一段代码,这段代码里可能包含了你对某个问题的思考方式、架构设计、甚至某些独特的实现技巧。如果这些对话数据被Anthropic收集,理论上就可以用来改进Claude本身。
Meta的逻辑是:我花了几十亿训练的模型,不能让我的工程师用竞争对手的AI工具,把知识"喂"给对方。
这道禁令有多荒诞?
荒诞的地方在于,Meta自己就是开源的。
Llama系列模型是全球使用最广泛的开源大模型之一,任何人都可以下载、使用、甚至商用。Meta靠开源建立了庞大的开发者生态,靠"开放"赢得了行业声誉。
但现在,这家公司开始防着自己人了。
更讽刺的是,Meta的CEO扎克伯格一直在公开场合批评OpenAI"不够开放",批评苹果"封闭生态"。结果自己内部却在限制工程师使用外部工具——这跟苹果的"围墙花园"有什么区别?
一位Meta工程师在匿名论坛上写道:"我们被要求用自家模型写代码,但自家模型在很多场景下根本不如Claude好用。结果就是工作效率下降了,但合规了。"
这背后是一个更大的焦虑
Meta的焦虑不是没有道理。
AI编程工具正在成为大模型公司最重要的"数据入口"。当你用Copilot写代码时,你的代码片段、你的编程习惯、你的项目结构,都在跟模型交互。这些数据对模型公司来说,是金矿。
OpenAI、Anthropic、Google都在争抢这个入口。谁占据了程序员的桌面,谁就掌握了最有价值的训练数据。
Meta的担心是:如果我的工程师每天都在用Claude写跟Llama相关的代码,那Anthropic就能从这些交互中学到——Llama是怎么设计的、哪些地方做得好、哪些地方有bug。这等于把竞争对手的训练数据,免费送给了对方。
这种担心在行业内不是孤例。去年底,就有多家AI公司指控竞争对手通过API调用"蒸馏"自己的模型。有的公司甚至发现,对方的模型在某些特定任务上的表现,跟自己几乎一模一样——连错误都一模一样。
对普通人有什么影响?
你可能觉得,这是大公司的事,跟我没关系。
但其实关系很大。
第一,AI编程工具的"站队"会越来越明显。未来你可能不能随意切换不同的AI助手——你的公司可能跟某一家签了独家协议,或者干脆禁止使用竞品。程序员的技术选型,不再只由技术决定,还由商业关系决定。
第二,AI工具的数据隐私问题会越来越突出。你今天用AI写的每一段代码、问的每一个问题,都可能成为对方训练下一代模型的素材。你以为你在用工具,其实你也在被工具"用"。
第三,大模型之间的竞争,正在从"谁的模型更聪明"变成"谁的数据更多"。蒸馏、数据抓取、生态封锁——这些手段会越来越常见。最终买单的,是每一个用AI的人。
这件事的本质是什么?
Meta这道禁令,表面上是"防止蒸馏",本质上是AI行业进入了"数据军备竞赛"阶段。
当模型能力差距越来越小的时候,数据就成了唯一的护城河。谁掌握了更多高质量的交互数据,谁就能在下一轮训练中领先。
这也是为什么所有大模型公司都在拼命推AI编程工具、AI搜索、AI助手——不是为了让你用得爽,而是为了让你多跟它说话,多给它数据。
Meta限制工程师用Claude,跟苹果限制开发者用其他应用商店,跟微信限制外链——本质上是一回事:控制数据流向,保护自家生态。
开放的时候说开放,封闭的时候说安全。大公司的话,听听就好。
真正重要的是:你用的AI工具,到底在拿你的数据做什么?这个问题,目前没有一家公司能给你满意的答案。


