席卷大厂的“隐形降薪”三联生活周刊
过去一年,互联网大厂里最重要的资源,不再是工位、服务器或加班时长,而是Token。Token是大模型处理语言的基本单位,也是AI运行时不断消耗的计算资源。每一次向大模型提问、生成代码、修改方案,背后都在消耗Token。为了推动“All in AI”,今年春天,多家互联网大厂几乎同时向员工开放大额Token额度,把它作为AI提效的燃料,也把它变成新的绩效指标。一时间,员工比拼的不再是谁写了多少代码,而是谁“烧”了更多Token。但这种竞赛很快开始降温。随着Token成本迅速攀升,多家企业开始大幅削减额度,转向精细化管理。企业逐渐意识到,AI确实能够提升单个环节的效率,但真正制约生产力的,仍然是人与人之间的协作、组织流程,以及产品落地过程中那些难以量化的判断。从疯狂“烧Token”到重新计算消耗,互联网大厂开始试图在效率与成本之间寻找平衡。
疯狂“烧Token”
工作的第一个月,王天夫就在Token上花费了近300美元。他今年24岁,在一所“985”大学读研二,3月进入一家头部互联网科技大厂担任技术岗位实习生,一进来就赶上部门召开三四百人的大会,“部门大领导说,所有人要全力拥抱AI。我还没反应过来,团队负责人马上给我制定了工作目标:原来半个月或一个月的工作量,现在要压缩在一周内完成,原本需要三四个人做的预研,只有我一个人做。”
《这个不可以报销!》剧照
随着工作节奏变快,他几乎没有喘息时间,每天下班后回到出租屋,就开始担心明天的工作能否顺利完成。这与他之前在学校里设想的工作场景完全不同,“已经没有程序员在手写代码了,从技术方案到所有代码,以及对代码的修改与评审(review),现在全部由AI完成。做前期调研时,也会让AI去总结项目的基本逻辑和框架。”
当AI替代人类拼命工作时,燃烧的是Token。Token(中文译为“词元”)是大模型处理文本时的基本单位。 当用户输入自然语言时,模型不会直接理解汉字、单词或句子,而是先将文本拆分成一个个 Token,再基于这些 Token 进行理解、推理和生成回答。模型的上下文长度、处理速度、计算资源消耗以及使用成本,都是以 Token 为单位衡量的。主流模型中,1 个 Token 大约相当于 0.6 个汉字
王天夫介绍,此前,该大厂只提供少数几个国产大模型免费使用,但在执行复杂的长程任务时经常卡顿,“思维过程很慢”。从3月中旬起,所有产研人员都获得了每人每月2000美元的Token额度,可以在CodeBuddy(一款AI编程工具)或企业内部的大模型聚合平台上使用——国外的几个顶尖大模型都可以调用。他最常用的是由美国企业Anthropic开发的大模型Claude,“它的理解能力很强,甚至不需要明确告诉它每一个步骤,Claude自己就能做一些脑补,完成任务的效果很好。”
《完美求婚》剧照
4月初,另一家头部大厂也宣布了新的Token报销福利:产研序列员工使用AI产品的支出可以报销50%,每人每年的报销上限是1000美元,其他序列员工为300美元。多位大厂员工告诉本刊,今年3-4月,各互联网大厂几乎同步发放Token额度,不同业务线存在一定差异,主要倾向于研发部门。超额可以申请额外的Token,“基本都会审批通过。”
刘明洋今年37岁,程序员出身,曾在阿里、百度等企业任职过,现在是一家大型科技企业的中层技术主管,该企业有2万余名员工,年营收约在两三百亿元。他对本刊说,公司每月都会统计各部门的Token消耗量,今年对部门主管的年终绩效考核,还新增了“部门AI素质”这一项。他解释,由于公司的业务偏向于应用与服务,原本的绩效考核只看业务结果,围绕营收增长率等几个主要的经营性指标,今年还要看过程——产出的增加,究竟是逼着人工加班堆上去的,还是通过AI提效?
《一点点超能力》剧照
“使用AI的具体过程很难量化,唯一能参考的,只有Token消耗量这个单一指标,非常直观。”他听说,为了让指标好看,有不少下属会把Token用在和工作无关的事情上,“但我不在意。”刘明洋说,“老板让部门之间相互卷,如果隔壁部门汇报的Token消耗量很多,我会感到很恐慌,觉得不能被领导看低。”王天夫看到,在3-5月的这三个月里,包括他自己在内,所在部门的程序员使用Token时“毫不节制”。“Claude 的Token价格比国产模型要贵几十倍,我们基本什么活都交给它,哪怕是一些可以用国产模型完成的简单工作。甚至只要模型一更新,马上就切换到最新、也是最贵的版本。”
一位头部大厂的算法工程师告诉本刊,公司内部甚至有一个员工自发组织的Token排行榜,有上千名程序员参与。他目前主要从事Agent研发,每天让 GPT-5.5帮他“从早跑到晚”,日均Token用量大约在15-20亿,能排在前20名,据他估算,这个使用量级,每天就能烧上万元。有多位大厂员工透露,有部门领导会在周会上点名表扬Token排名最高的员工。如果Token使用过低,则会被单独约谈。
《重启人生》剧照
张烨是某头部大厂的一名产品经理。他对本刊说,即使没有公布排名,员工心里也很清楚,领导会在内部的管理平台上实时监控每个人的Token消耗情况。他身边,有同事甚至将每天烧了多少Token写进飞书的个人动态签名。另一名科技大厂的运营人员则告诉本刊,他在职场社交平台脉脉上看到,他所在的公司有员工发帖炫耀称,通过“给AI虚开需求”等特殊手段,让Token使用量“冲到了小组第一”。
“拼命烧Token”背后,是互联网企业对“All in AI”(全面押注AI)的焦虑。
今年春节,刘明洋就连续开了几次管理层线上会议。过去,老板很少会在春节期间密集布置工作。隔着屏幕,他都能感受到对方脸上的焦虑。在沟通日常工作的管理层大群里,刘明洋的老板不停地把一些标题夸张的自媒体文章丢进来让大家阅读。“写的都是某公司裁了多少人,用AI提高了多少倍效能。”他发现,企业最高层的焦虑,比中层和基层要严重得多。
《谈判桌》剧照
刘明洋说,春节回来后,公司的AI转型明显加速,每个部门的AI预算都提高了两三倍。组织层面开始频繁调整,所有资源向AI相关的业务倾斜,一些作为营收支柱的传统业务却逐渐被边缘化。
清华大学计算机系长聘教授刘知远对本刊指出,这一轮“All in AI”的转型背后,有两个核心的技术驱动力。一是大模型在AI Coding(编程)上的巨大突破。自2024年下半年起,大模型的编程能力开始指数级跃迁,到2025年已彻底改变传统的软件开发方式。
刘知远对此有亲身体会。2022年8月,他牵头创立大模型企业面壁智能。2025年4月起,他推动团队全面转向AI Coding。到年底,200名程序员仅用8个月便完成了2000万行代码。“没有AI,这些工作量至少需要1000名工程师完成,相当于约5倍的效率提升。未来企业甚至能做到10倍、20倍,乃至100倍。”在刘知远看来,这意味着,AI赋能下,企业的规模与产出正在脱钩,“未来,一个100人的公司,创造的价值可能超过拥有数万名员工的大厂。大厂怎么可能不焦虑?”
《胜券在握》剧照
另一个驱动力是Agent(AI智能体)的兴起。这意味着,大模型实现了从“chat(对话)”到“work(工作)”的转变,开始真正进入不同的业务场景,替人完成具体工作。“两股技术浪潮在今年汇聚。”刘知远说。
前钉钉副总裁张斯成对本刊说,在所有与AI密切关联的企业中,互联网大厂的焦虑最深,因为AI可能彻底颠覆互联网时代的商业模式。张斯成2019年底离开钉钉,近年来主要参与AI领域的投资,接触了大量企业管理层。他分析说,在上一个互联网时代,核心商业模式是对人类用户的注意力进行垄断和定价,以短视频平台为例,其通过不断优化各种算法,可以最大程度地匹配广告投放与目标受众,广告商因此有动力付费。然而,当Agent时代到来后,信息流动的参与方,就不止是人类用户,还包括大量的Agent,原先以人类注意力为抓手的商业变现过程,就会发生根本的变化。
“至于该怎么变,如何达到新的商业平衡,目前大家都还在探索,但每个大厂都希望自己能拨得头筹。新一轮厮杀与竞争比过去更残酷。”张斯成说,游戏规则只有一个——“慢则死”。一位接近某互联网头部大厂的企业高管告诉本刊,这一轮AI转型中,该企业走得相对激进。6月中旬时,他和企业的中高层交流,了解到其目前的主导战略共识是:AI已经可以视为一个“完全的生产力”。未来公司的资源配置与产品部署都以此为出发点,也就是说,会把更多资源放在Token上,人力成本则要大规模缩减。
《凡人歌》剧照
“在整个互联网科技圈,激进派占了主流。不过,有同样想法的企业CEO虽然大约有60-70%,真正这么做的只有20-30%。”平凯星辰副总裁、原阿里云副总裁刘松对本刊说。刘知远指出,企业越大,组织惯性越大,转型的难度也更大,想法常常难以落地。很多没有包袱的小企业比大厂还要激进得多。
想要在短时间内推动全员“All in AI”,“烧Token是一个最直接的办法。”张斯成说。
太平洋另一侧的硅谷,同样的疯狂正在上演。在2026年初,互联网科技巨头Meta也在内部上线了一个排行榜“Claudeonomics”,用于跟踪公司超过85000名员工的Token使用情况。短短30天内,Meta员工的Token消耗量就超过了60万亿,约相当于9亿美元。“企业管理者心里一定清楚,这个过程中有很多Token会被浪费,也可能导致一些表演性行为,但这是转型必然要付出的成本。”张斯成说。他还指出,企业在试错的同时,本质上,也是在进行一场组织内部的大筛选——擅长用AI提效的人适合留下,转型不够快的人就会被抛弃。
《东京奏鸣曲》剧照


