Meta员工写外挂作弊冲榜，1个月烧掉200万新智元

Meta内部搞了个AI用量排行榜「Claudeonomics」，8.5万员工拼消耗、冲段位、抢「Token传奇」称号。有人一个月烧掉200万美元，有人写外挂冲榜，有人挂着Agent睡觉也在跑——硅谷卷Token，已经卷到走火入魔了。

一个人，30天，烧掉3285亿token！

按Anthropic公开定价粗算，这些烧掉的算力成本接近200万美元。

4月初，The Information记者Jyoti Mann在X上首次曝光Meta内部「Claudeonomics」排行榜，30天全公司token总消耗超60万亿。

这些疯狂的数字，来自Meta内部一个名叫「Claudeonomics」排行榜的比赛，8.5万人参与的烧token大赛，只展示前250名。

从铜牌、银牌、金牌、铂金、翡翠，一路升到「永恒会话」（Session Immortal），再到最高荣誉「Token传奇」（Token Legend）。

没错，烧token都烧出段位来了。

这笔账到底有多大？The Information专门做了一个计算器来拆解：

The Information报道中附带的交互式token成本估算器，按Claude Opus 4.6占86%的模型配比、70%缓存命中率估算，1万亿token理论成本约550万美元。

当然，这只是按公开价的估算，但数据量级本身已经足够炸裂。

如果放到整个Meta来看，这个数字更恐怖：最近一个月token总消耗约60.2万亿。

这是什么概念？

The Information做了一个估算：美国国会图书馆全部藏书折算约2.66万亿token，Meta的Llama 3训练数据是15万亿token，人类历史上所有出版书籍加起来估算约20万亿token。

Meta员工30天烧掉的token量，是人类全部出版物的3倍！

这还只是开始。一周之后，这个数字据报道跳到了73.7万亿。

消息传开后，业内知名技术博主Gergely Orosz在X上一针见血地评论：

Token用量已经是Meta绩效评估的一部分。聪明人在刷他们认为领导想看的指标，就这么简单。

这已经不是某个工程师在用AI写代码的故事了，而演变成一场超大规模AI消耗竞赛游戏：

覆盖数万人，有排名、有称号、有荣誉体系。

排行榜就消失了

The Information的报道发出后，Meta内部炸开了锅。

有员工在内部讨论区写道：

我建议大家算算这背后的能源消耗。要不是真的在发生，我会以为是个笑话。

到了周三，排行榜从Meta内网消失了。

Meta发言人对外的说法是：排行榜是由创建者自行撤下的，不是公司下令。

公司强调，员工评估看的是「实际交付影响」，不主张把个人token数据作为评估绩效的主要方式。

但Meta发出的信号是矛盾的。

据The Information报道，Meta内部一个名为Checkpoint的AI驱动绩效追踪系统，确实将token使用量列为数据点之一。

排行榜虽然撤了，但公司官方的AI Insights仪表盘仍然对所有员工开放，你随时可以查看自己和团队的token消耗。

Meta发言人表示，AI Insights仪表盘的目的是帮助公司了解各组织如何向AI原生的工作方式转型，它提供的洞察不只是token用量，还包括代码相关指标和其他维度。

虽然，Meta停掉了排行榜，嘴上说不以token论英雄，但排行榜的逻辑仍然存在，这让不少员工感受到公司释放出的信号并不完全一致。

「代码行数」

披上token新衣

这个排行榜虽然只存在了几天，但它已经催生出了一套「刷分」操作。

据The Information援引匿名员工描述，一些Meta工程师想出了各种办法来膨胀自己的AI使用指标。

比如，一些工程师会让AI Agent 生成大量细小改动，这些改动对功能帮助有限，但每次仍会形成一次commit，从而抬高其AI使用指标。

量上去了，排名自然好看。

还有人开发了转录机器人，挂在会议里自动做记录。

有的人甚至专门鼓励同事来用自己开发的转录工具，因为只要别人通过你的工具跑token，消耗量就算在你头上。

类似的事不只发生在Meta。

亚马逊电商部门去年也出现过一个案例。

一位经理暗示团队应该更多使用AI编程工具Cline。于是团队里有人直接改了代码，让每次和Cline的对话看起来消耗了10倍的token。

这个团队的AI使用排名迅速冲到了分部前列。

不过到今年年初，亚马逊调整了系统，这个「作弊码」失效了。

这些故事看起来有些荒诞，但熟悉软件行业历史的人一定不陌生。

Box CEO Aaron Levie直言：这让他想起了AI出现之前，行业里围绕「用代码行数衡量程序员产出」的那些老争论。

代码行数也曾经被当作生产力指标。

结果工程师们学会了把一行能写完的逻辑拆成十行：指标涨了，产出没变，甚至更差了。

现在，同样的故事只是换了个计量单位：代码行数变成了token数。刷行数变成了刷commit、挂转录机器人、改系统让数字翻10倍。

指标可量化，又和绩效沾边，就一定可能会「玩坏」。

据The Information报道，有Meta员工私下承认，那些token用量低的人，有时候会焦虑自己看起来「不够AI native」。

同时这位员工也认为，高token用量不应该成为一种身份符号，因为它并不是生产力的好指标。

不卷token的公司

既然刷token排名的逻辑漏洞这么明显，有没有企业选择另外一条路？

执法装备的公司Axon选择了把AI激励绑定在业务交付上，而不是消耗量上。

他们的做法是团队如果利用AI工具超额完成年度路线图目标15%以上，就能拿到现金奖金。

Axon总裁Josh Isner透露，今年公司各团队集体的路线图超额幅度正在追踪到30%左右，主要归功于Claude Code和Cursor的使用。

预计今年在AI编程工具上的支出将达到「数千万美元」级别。

Isner认为，当你引入「尽量多用这个工具我们就付钱」这种考核的时候，风险越来越大：

你怎么知道你得到的是你想要的结果，或者说，到底有没有任何结果？

Aaron Levie并不鼓励tokenmaxxing，也不认为它会在硅谷之外的大公司里广泛流行。

不过他也表示，自己理解这种冲动，因为当前阶段需要先让工程师充分试用这些工具。

他选了另一种方式：既然AI能让团队更高效，那就把产品目标定得更高。员工能不能完成这些加码后的目标，直接影响薪酬。

但Levie也没有一刀切地否定token消耗。他认为应该容忍一定程度的token「浪费」，因为那意味着团队在尝试新东西：

硅谷现在正处于这样一个阶段，你得让工程师去试这些工具。

Levie愿意为试错买单，但不愿意把「谁烧得最多」变成一种排名机制。

Axon和Box代表了一种观点：token只是弹药，你用了多少不重要，你使用它做出了什么才重要。

当油表被当成速度表

Meta的排行榜被撤了，但背后催生它的那股力量依然强大：

硅谷高管们集体把「多烧token」等同于「高生产力」的叙事一点也没有减弱。

英伟达CEO黄仁勋

英伟达CEO黄仁勋就曾在All-In Podcast上说过一句被广泛引用的话：

如果一个年薪50万美元的工程师，连至少25万美元的token都没用掉，他会「高度警惕」。