如今Claude Code的代码100%是由它自己编写51CTO技术栈
“在我们发布 Opus 4 和 Sonnet 4 的前后,那是去年的 5 月,增长就变成了指数级的,我从未见过如此迅猛的增长。”
“自引入 Claude Code 以来,Anthropic 每个工程师编写的代码量增长了大约 250%,而且这是在保持代码质量、可靠性等指标基本稳定的前提下实现的。”
“快进到今天,Claude Code 100% 是由 Claude Code 编写的。Cowork 100% 是由 Claude Code 编写的。”
Claude Code 创始人兼负责人 Boris Cherny 的最新访谈播客来了!
过去一年,Anthropic 产品的需求量增长了 80 倍,年经常性收入(ARR)据说也从去年的 40 亿美元飙升至现在的 450 亿美元。
连 Boris 自己都说,他从业多年,从未见过 Claude Code 这种夸张的增长速度,越来越呈指数级,一次又一次迎来增长拐点,势头惊人。
自从有了 Claude Code 后,除 Anthropic 内部的代码产出量已经提升约 250% 之外,他们服务的许多公司也都报告了数百个百分点的生产力增长。
而 Claude 出现之前,他还在 Meta 工作时,通常每年只能提升 1~3% 的生产力。现在回头看,简直像是两个时代。
更出乎他意料的是,越来越多不是程序员的人,也开始使用 Claude Code 开发应用。最近一场 Opus 4.7 黑客马拉松中,冠军居然是一位医生。参赛者还有电工、木匠,甚至有人直接靠它做出一家初创公司并成功卖掉。
他还讲到一个非常有冲击力的事实是,今天 Claude Code 的代码,已经 100% 由 Claude Code 自己编写,它还编写了 Cowork 和 Anthropic 的各种产品中的许多功能。
就此来看,他认同 Anthropic 的创始人之一 Jack Clark 最近的预测:到 2028 年,AI 模型有 60% 的概率开始实现自我改进。
他说,当下 Claude 已经开始为 Claude Code 接下来应该构建什么功能,自主产生想法了。不过想法并不总是好的,绝大多数点子依然是由他来提出。
但他认为,未来某个时刻,会出现那个自我强化闭环的转折点。
聊到 AI 泰斗 Yann LeCun “LLM 不能实现 AGI” 的观点时,Boris 说想邀请他用 Claude Code 一起编程 1 小时,看看他会不会改变主意。
他还提到,Anthropic 已经发表了不少研究,阐述这些模型是如何具备规划能力和实际推理能力的,AI 可能不仅仅是在预测下一个 Token。
在这里,主持人补充举了“当 Claude 在写第一行诗时,能在模型内部看到,它们已经在构思下一行了”的例子,这还蛮打破行业认知的。
最后,Boris 现在的编程方式也很惊人。除了不写代码、写 Prompt 来引导 Claude 写代码之外,他还会让 1 个 Claude 去引导一堆 Claude。
白天,他的电脑上会同时运行 5 个 Claude。到了晚上,大多数时候他会同时并行运行数百个、甚至上千个 Claude!
讲真,大佬了解的信息和实际操作真的让人大开眼界,更多精彩内容见以下访谈全文:
Claude Code 爆发式增长,持续突破增长天花板
主持人:Boris,很高兴见到你,欢迎来到节目。
Boris:好的,谢谢你邀请我。
主持人:那么,首先让我们来谈谈 Claude Code 的增长。它一直很庞大,对吧?我想在最近的一次活动中,Anthropic 的 CEO Dario Amodei 谈到,对 Anthropic 产品的需求同比增长了约 80 倍。我记得去年这个时候和他交谈过,他当时为 Anthropic 的年度经常性收入(ARR)达到 40 亿美元而感到兴奋。现在看来这相当... 目前的数据显示可能已经是 450 亿美元了,对吧?
所以,那里有 10 倍的增长,80 倍的需求。问题是公司满足这里需求的速度有多快。但请谈谈 Claude Code 占总需求的比例,以及你在需求增长和全世界越来越多的人使用这个产品方面看到了什么。
Boris:我认为你使用 Agents 的方式以及你使用 AI 的方式,不仅限于 Anthropic 的产品,尤其是 Claude Code。当然,对 Anthropic 来说,有很多不同的产品。有 Claude Code,有 Claude Chat,有 Claude Design,有 Cowork,还有像 API 产品。体验 Anthropic 的方式有很多。但是对很多人来说,Claude Code 是他们的初次体验。
是的,这种增长简直是疯狂的。你知道,当我们最初在内部发布它时,它立即就直线上升。所以在我们向 Anthropic 外部的任何人发布 Claude Code 之前,我们就觉得这很可能会大受欢迎。而在我们发布 Opus 4 和 Sonnet 4 的前后,那是去年的 5 月,增长就变成了指数级的,我从未见过如此迅猛的增长。然后随着 Opus 4.5(那是 11 月)以及 4.6(那是今年 2 月),然后是 4.7,它就变得越来越呈指数级,它只是不断地一次又一次迎来拐点。
你知道,我们团队里有很多人在科技界工作了很长时间,你知道我们做过各种各样的超速增长产品,这是你在科技界经常谈论的东西,比如这些独角兽和超速增长,但即使在团队内部,我们也从未见过这样的增长。所以我们只是在努力弄清楚,我们该如何做才能让所有人都能继续体验这个产品,我们该如何做才能让我们继续保持这样的速度增长,以及我们对未来的预期速度,未来甚至可能比今天还要迅猛。我们正在学到很多关于如何做到这一点以及如何继续扩展服务的知识。
颠覆传统开发, Anthropic 全员编码量暴涨约 250%
主持人:我相信你一定听说过这个。就是一些公司出台了硬性规定,要求员工尽可能多地运行 AI 智能体,以此来消耗大量的 AI Token(tokens)。然后,那些使用Token最多的人会在排行榜上获得奖励,或者借此达到他们必须完成的“AI 行动指标”(而不是实际的人工行动)。所以我想听听你对这种“Token最大化(token maxing)”现象的看法,以及你是否认为这在你们所打造的产品的使用量中占了很大一部分。
Boris:对,我认为 Token 最大化所占的比例并不大。我对此的思考方式是,你知道,在加入 Anthropic 之前,我实际上在 Facebook 这家大厂工作过。我当时在 Facebook,它也是被传在搞 Token 最大化的公司之一。没错,确实是这样。
当时我的职责之一就是负责 Meta 旗下所有应用(比如 Facebook、Instagram、WhatsApp)的代码健康。我们之所以关心代码健康(这基本上就是指代码质量等指标),是因为如果代码质量非常高,工程师的生产力就会更高。当时有一个庞大的团队专门负责提高生产力。在模型出现之前,在 Claude 出现之前,你努力工作很长一段时间,在一年时间里,每个工程师的生产力大概只能提高 1%、2% 或 3% 左右。这已经是一个相当大的进步了,而且来之不易。你基本上必须尝试很多想法,最终才能找到能这样提升生产力的方法。
而有了 Claude 之后,现在包括 Anthropic 在内的许多公司以及我们所有最大的客户,都报告了数百个百分点的生产力增长。我想我们最近公布的数据是,自引入 Claude Code 以来,Anthropic 每个工程师编写的代码量增长了大约 250%,而且这是在保持代码质量、可靠性等指标基本稳定的前提下实现的。也就是说,在这些指标没有倒退的情况下,代码量大幅增长。
打破固有认知,许多 AI 生产力提升和创新来自非工程师
Boris:我认为这种生产力冲击是非常前所未有的,大家都在努力摸索如何实现这一点。有很多公司都在问,我们如何才能获得这样的回报,因为很多公司看到了效果,而有些公司仍在摸索,我的建议几乎总是相同的。第一步就是给每个人分配 Token,让大家去尝试。我并不一定会推荐 Token 最大化(刻意刷量),但我建议让大家去探索,这样他们就不需要为每一个 Token 的使用都去申请审批。第二步是给员工提供心理安全感,因为很多时候,当人们在进行创新并构建能让他们更高效的工具时,他们是在改变自己的工作流来提高效率。他们会尝试一堆想法,有些可能行不通,有些则能成功。所以你想给人们这种心理安全感,让他们觉得尝试新事物、寻找新流程是没问题的。接着,许多公司会发现,生产力的提升和创新往往并不来自你预期的人。
在过去,团队里的每个人都能指出来谁是团队里最高产的工程师。但我认为在如今,许多提升都来自于你完全意想不到的人。他可能是你们组织某个角落的一位会计,他用一种任何工程师都想不到的方式实现了会计自动化;也可能是某位市场营销人员,以你绝想不到的方式实现了营销自动化;还可能是一位刚毕业的软件工程师,随手就做出了令人惊叹的东西。这在以前是根本不会发生的。挑战在于,你无法提前识别出这些工程师和人才。你不知道他们是谁,而且结果几乎总是会让你大吃一惊。
因此,你想做的是让大家去尝试、给他们安全感,一旦出现某种可以规模化的应用场景,那时候你再去考虑优化它。但你不想过早优化。所以,我不知道以竞争的方式进行(比如搞排行榜)是否适合某些公司的文化,如果适合,那我觉得很好。如果对其他公司来说,他们想做的方式只是创造安全感、为工程师提供尝试的空间(这也是我们在 Anthropic 所做的),那我认为这也很好。这完全取决于公司本身。
参照计算机时代红利,围绕 AI 重构业务流程才会获益
主持人:是的。而且我想说,你看,我也消耗了大量的 Token,我一直在使用这些工具。我认为 Claude Code 和 Claude Cowork 对我的业务都非常有帮助。我是一个独立经营者,虽然这有点说小了,因为我身后还有一个团队主要以兼职形式在帮我,不过那是另一期节目的内容了。但我确实很好奇,你知道,当我看这些故事时,大公司在这些预算中占了很大的比例,而那些激励措施,就像我在节目开始时说的,这有多大的可持续性?
在某些地方,这些激励机制其实挺糟糕的。这是《金融时报》最近的一篇报道:亚马逊员工使用 AI 工具处理不必要的任务以刷高使用率得分。一些员工表示,同事们正利用该软件自动运行额外且不必要的 AI 活动,从而增加他们的Token消耗量。他们说,此举反映了在亚马逊出台要求 80% 以上的开发人员每周使用 AI 的目标后,员工们面临着采用该技术的压力。我找了一位亚马逊员工核实了这件事。他们说:“是的,事实就是这样。”他们告诉我:“为了达到这些目标,我触发了一个每天运行数小时然后被删除的自动化流程。”
所以,你刚才说你认为这种“Token最大化” luminous 并不是需求的很大一部分。那么,你从你们那边能看到什么数据或迹象,表明这只是一个特例,而不是大多数地方的普遍规律吗?
Boris:是的,我不知道有多少公司在搞这种 Token 最大化的事情。我听说过这算是一种苗头或趋势。如果你看一下 Claude Code 的客户群,我们拥有非常非常多的客户。所以,并不是说有某一家大公司在凭一己之力拉动整体的使用量,情况并非如此。不过我确实想稍微往后退一步,思考一下这种变革是如何发生的。因为我认为这些公司真正想达到的目标,我不想替他们发言,我也建议直接去和他们聊聊,但他们想达到的目标,我认为大概是组织变革和业务流程的变革。
你如何让你的公司从 AI 中受益?这往往是不明确的。它非常取决于公司本身,因为每家公司都有不同的业务、不同的文化、不同的组织结构和不同的做事方式。90 年代有一篇《哈佛商业评论》的老文章,我非常喜欢它,名字我给忘了,但大意是《计算机已经来了,为什么没人看到生产力的提升?》。这在当时是一个大问题,对吧?现在对我们来说,计算机能让我们更高效是显而易见的,今天这简直再明显不过了。但在那个 90 年代,这并不明显。当时发生的事情是个人电脑开始普及,它们正在取代大型机,而且价格变得能够负担。所以普通的公司、普通的创业公司都能买得起一台,你再也不需要花几百万美元去买大型机了。
但当时存在一个挑战和悖论:公司确实采用了电脑,但他们没有看到生产力的提高。这是怎么回事?于是那篇《哈佛商业评论》的文章提出了一个观点:为了从计算机中获得回报,你必须围绕计算机重新构建你的整个业务流程。电脑必须处于你做事方式的核心。如果你仍然使用纸张、文件柜,还有一堆塞满东西的抽屉,它依然是一个纸笔形式的物理流程,而电脑只是放在某个边缘位置,那你真的不会从中受益。但如果你扔掉文件柜,扔掉塞满纸张的课桌抽屉,把电脑放在核心位置,让它成为你处理所有业务流程的方式,那么你就会受益。
在当时,公司之间就出现了这种分化。有些公司这样做了,他们进行了相当痛苦的变革并从中受益,而另一些公司则没有。我认为现在的情况也差不多。许多公司正试图弄清楚如何从 AI 的生产力冲击中获益,目前有大量的尝试,每个人都在采用不同的方法来寻找获益之道。我认为并没有一种唯一正确的方法。
解决 Token 浪费难题,Claude 投入度机制平衡效率与成本
主持人:好的。你看,当看到像 Claude Code 这样快速增长的产品,以及像 Anthropic 这样迅速壮大的公司时,能把这些事情聊透是非常棒的,能听到你的观点也很好。行,那这就是关于“Token最大化(token maxing)”的内容。
那么,Tokens 当然是模型的输出,比如模型输出的单词或单词的一部分,以及输入的单词或单词的一部分,对吧?这也是这些公司收费的方式,你消耗的越多,需要的数据中心就越多,等等。随着这些模型变得越来越好,它们并没有,这么说吧,有时我在想它们是否已经达到了应有的高效。这些大模型有时会做大量的工作,消耗大量的Token,即使最终的输出很棒,人们也会纳闷:这会不会只是在推高Token需求,而本可以是一个非常简单的过程,结果模型消耗了成千上万的Token,却没有以最高效的方式达成目标?
让我给你举个例子。我一直在用 Claude Co-work 来做 PowerPoint 演示文稿,它在这方面真的很擅长。我一直在使用 Opus 4.7 模型。有几次我说:“好,你正在处理这个文件,把它作为 PDF 发送出去。”结果它就开始抓狂了。它不断循环,尽可能多地调用工具,似乎就是无法把 PDF 发出来。最后,我一直对它说:“不对,你正在做这个 PowerPoint,你知道它在哪里,发出去。”然后它回答说:“额,我必须向您道歉,我陷入了一个死胡同,去担心一个实际上并未阻止我们的限制条件,文件就在那里。”然后它就把文件发出去了。我是说,请谈谈这些模型的效率,这是否是一个合理的担忧?正如我们所看到的,增长的一部分其实伴随着像 Opus 4.7 这样的模型在执行基础任务时可能会陷入的这种“无限循环”。


