Mythos实现“近两年最大能力跃迁”华尔街日报
Patel指出,Anthropic新模型Mythos实现"近两年最大能力跃迁",仅两个月从L4跨越至L6工程师水平,"执行成本极度廉价"。需求爆炸导致供应链全线告急:DRAM价格或翻2至3倍,台积电2028年资本支出或达千亿美元,CPU严重短缺。在技术的狂飙突进和资本的疯狂盛宴之外,美国社会公众抵触情绪正成为不可忽视的宏观变量。
AI模型迎来“近两年最大能力跃迁”,供应链全线告急,美国民愤情绪一触即发——这是SemiAnalysis创始人Dylan Patel在最新访谈中给出了对当下AI革命最直白、最辛辣的判断。
4月23日,知名半导体及AI行业研究机构SemiAnalysis首席执行官(CEO)Dylan Patel在一场深度访谈中,详细拆解了当前AI行业的供需动态、代际技术突破以及潜在的社会宏观影响。
Patel的公司SemiAnalysis是华尔街和科技投资圈高度关注的AI基础设施独立研究机构,其客户覆盖顶级对冲基金和科技企业。他在访谈中以自身公司的AI使用数据为切入口,引出了对整个AI产业供需格局的深度研判。
他透露,SemiAnalysis去年的AI支出仅为数万美元,但由于员工(甚至是非技术人员)开始疯狂使用Claude等AI工具进行代码编写和数据分析,今年的年化Token支出已经飙升至700万美元。
他指出,Anthropic等头部机构的新模型实现了“近两年最大能力跃迁”,仅用两月便从L4跨越至L6级工程师水平,让“执行变得极其廉价”。然而,这也导致硬件供应链面临“极度短缺”,DRAM价格或将翻两至三倍,台积电2028年资本支出有望触及千亿美元。
值得警惕的是,随着技术向经济系统渗透,底层失业焦虑加剧,预计三个月内美国或爆发针对AI的大规模抗议,公众抵触情绪正成为不可忽视的宏观变量。
模型“近两年最大能力跃迁”
驱动这场Token消耗狂潮的核心,是前沿模型能力的爆炸式增长。
在访谈中,Patel特别提到了Anthropic未公开发布的神秘新模型(代号Mythos)以及最新版的Opus。他指出,随着Scaling Laws(缩放定律)的持续生效,模型的迭代速度正在从过去的六个月大幅压缩至两个月。
“Mythos可能是近两年来模型能力的最大跨越。”Patel强调,“Anthropic最初的目标是在2025年底前让模型达到L4级软件工程师的水平,他们在Opus 4.6上基本实现了这一点。但如果你看Mythos的基准测试,它已经达到了L6级工程师(资深专家)的水平。从L4到L6,他们仅仅用了两个月。”
这种能力的跃迁正在从根本上改变商业世界的运行逻辑。过去,市场的法则是“想法很廉价,执行极其困难”;但在新一代模型的加持下,这一逻辑被彻底重写:
“现在想法廉价且丰富,而执行变得非常容易。因此,只有真正好的想法,才能证明在极其廉价的执行上花费资金是合理的。”
Mythos的出现还验证了一个关键命题:Scaling Laws仍然有效。Patel明确表示,Mythos是一个"materially larger model"(明显更大规模的模型),训练规模等效于10万块Blackwell芯片,且"所有迹象都表明,往模型里砸更多算力,模型就会变得更强"的趋势线依然成立。
供应链“极度短缺”
极端的模型算力需求直接导致了物理世界供应链的全面告急。
Patel指出,尽管云服务商和芯片制造商正在疯狂扩产,但供给侧几乎在每一个节点上都处于“极度短缺”状态,且全产业链的利润率正在不可逆转地扩张。
“随着需求飙升,供应端所有东西的价格都在上涨。”他打破了市场关于GPU使用寿命较短的固有认知:“有人认为GPU的使用寿命不到5年,这完全是胡说八道。现在有3到4年机龄的Hopper集群正在续签未来三四年的合同。有效寿命显然不是5年,甚至可能是7到8年。”
在更广泛的半导体供应链中,短缺现象同样令人咋舌。Patel重点提示了存储芯片和晶圆代工环节的惊人预期:
▪︎首先是存储芯片:“真正的增量供应(incremental supply)在2028年之前都不会到来。DRAM的价格将从现在起翻倍甚至翻三倍,因为他们必须通过更高的定价来摧毁部分需求(demand destruction),资本主义经济不搞配给制。”
▪︎其次是代工与设备:“人们没有关注到台积电未来的资本支出。到了2028年,台积电的资本支出可能会达到1000亿美元。人们觉得这很疯狂,但这绝对是一个真实的可能性。”
此外,Patel特别强调了两个容易被忽视的瓶颈:
CPU:被严重低估。原因有二:一是强化学习(RL)训练环境完全运行在CPU上,而非GPU;二是AI生成的代码和内容最终都要部署到基于CPU的服务器上运行。"CPU完全售罄,需求在暴增。"
PCB铜箔、玻璃纤维、激光器等小众上游材料:同样供应极度紧张,订单预付款现象普遍,即便毛利率未必大涨,投入资本回报率(ROIC)正在显著提升。
Patel的整体判断是:"经济价值最好的模型所能创造的价值,正在以比我们实际供应Token能力更快的速度增长。这个缺口会持续扩大,模型厂商的利润率会持续扩张,直到硬件供应链里的人也开始说,'等等,为什么我们不把自己的利润也拉上去'。"
美国民愤情绪正在积累
在技术的狂飙突进和资本的疯狂盛宴之外,Patel对AI引发的美国社会情绪发出了极其严厉的预警。
他指出,随着企业利用AI大幅提高效率并可能随之裁员,美国普通大众对AI的敌意正在迅速逼近临界点。
“我认为三个月内,就会出现针对大模型公司的大规模抗议活动。”Patel在访谈中直言不讳。他列举了近期的极端事件:
“Sam Altman的房子在两周内两次被人投掷燃烧 瓶,而新闻评论区里人们竟然在欢呼,这仅仅是个开始。AI现在比政客还要不受欢迎。”
他将这种公众愤怒部分归咎于美国AI公司高管的公关策略失误。他认为,美国头部AI公司的掌舵者(如Sam Altman和Dario Amodei)在面向公众时缺乏魅力,且过于热衷于谈论AI将如何“改变整个世界”和“自动化所有工作”。
“他们需要停止不断谈论未来的能力将如何改变世界,因为普通人与此毫无联系,这只会让他们对这种能力感到恐惧。他们必须开始展示AI能带来的令人振奋的现实用例。”
访谈文字实录译文(由AI辅助翻译)
注:Dylan Patel,半导体研究机构SemiAnalysis首席执行官
主持人Patrick O'Shaughnessy,风险投资公司Positive Sum首席执行官
Dylan Patel:
过去,执行非常重要,因为执行非常困难,而想法则很廉价。现在想法既廉价又充裕,但执行变得非常容易。所以真正重要的,只有那些好想法,才是能够证明在超级廉价的执行上花费是值得的。
你跟我讲过一个令人难以置信的故事,关于你自己团队对token的使用今年发生了多么巨大的变化。是的,零售,讲讲那个故事,以及它在教你关于这个世界正在发生什么。
Dylan Patel:
去年,我们以为自己是AI的重度用户。每个人都在用ChatGPT,每个人都在用Claude,每个人都有,你知道,我为公司里任何人提供他们想要的订阅,花费大概在几万美元的量级。今年,花费就直线飙升了。这真的是从去年十二月底Opus推出开始的,其中包括Doug,他是总裁,Douglas。他非常像是在领头冲锋,意义在于像他这样的非技术人员在用AI写代码。所以他基本上慢慢地把整个公司都带进来了。我认为他一直是这方面的领头人。显然,工程师们无论如何都在用,但一月份的花费就开始拐点向上,然后不断飙升、飙升、飙升、飙升。我们签了,你知道,与Anthropic的企业合同,现在已经到了这个地步——我想我上次和你说的时候,花费是500万,对吧?现在实际上是700万的花费。
那是上周的事,顺便说一句。
Dylan Patel:
其中很大一部分就是使用量,对吧?真正的情况是,你知道,那些以前从未写过代码的人,现在在用Claude Code,有时一天花几千美元,遍布整个公司。我们现在每年在Claude Code上花700万美元。按照目前的速度,而我们的薪资支出大约在2500万美元左右。所以,你知道,我们在Claude Code上的花费占薪资的比例超过了25%。如果这个轨迹持续下去,那么,你知道,到今年年底,我们在Claude Code上的花费将超过薪资总额的100%,这有点令人恐惧。
Dylan Patel:
幸运的是,我不必在人和AI之间做选择,因为我们公司增长非常快。情况更像是,好吧,我不需要那么快地招人,我可以在AI上花更多钱,而且它确实有效,我们只是增长得更快了。但我认为其他人将开始面对这样一个现实:如果这个人能用Claude Code完成五到十到十五个人的工作,那么突然之间,我或许应该裁员了。
Dylan Patel:
但就目前而言,我认为使用场景非常广泛。举个例子,我们在俄勒冈州有一个逆向工程实验室,我们已经建了一年半了。我们有一堆,你知道,高级显微镜、扫描电子显微镜。这整个实验室的目的是对芯片进行逆向工程。你从中提取架构,获取他们用于制造的材料。这是我们出售的一些数据。分析这些数据是一个非常缓慢的过程。然而,团队里的一个人,他用几千美元的Claude token,就能够创建这个应用程序——它是GPU加速的,运行在我们在Core Weave的一台服务器上。每当我们发给它一张图像,它就能拍下芯片的照片,并叠加标注出每一种材料在哪里。哦,这部分是铜。哦,栅极的这部分是钽。栅极的这部分是锗。栅极的这部分是钴。这样你就可以非常快速地对芯片的整个堆叠结构进行有限元分析。带有仪表盘图形界面,可视化。一切都有了。就花了几千美元的token。
Dylan Patel:
这个人之前在英特尔工作过,他说那曾经是整个团队的工作,负责构建和维护那个系统。现在把这个乘以整个公司的规模。太疯狂了。
Dylan Patel:
另一个我认为非常有趣的例子是Malcolm。他之前是一家大型银行的经济学家。那家银行的经济学家部门大概有一两百人。他构建的东西是有史以来最令人难以置信的。他把各种不同的数据都接入进来,你知道,Fred数据以及所有其他数据,对不起,就业报告以及来自各种API的其他数据。我们与一些机构签了几份合同,获得API来访问数据,把所有数据都整合进来,开始跑回归,开始研究各种经济变革从通缩、通胀角度对经济的影响。美国劳工统计局,整个劳工统计局有整整一套大约2000个任务的清单。所以他用AI对这些任务进行了分析——哪些可以由AI完成,哪些不能,并按照一个评分标准对它们进行评级,你知道,大约3%的任务现在可以由AI完成。所以他创建了这样一个指标,你可以用它来衡量哪些事情可以由AI完成,以及能够用AI完成这些事情的巨大通缩效应是什么——也就是说,产出可以上升。他把它叫做"幽灵GDP"。幽灵GDP。产出可以上升,但因为成本下降得如此之多,理论上GDP实际上会萎缩。所以他创建了这整套分析,以及一个全新的语言模型基准测试——不是跨2000封不同的电子邮件,而是……对吧?
这全都是他一个人做的?
Dylan Patel:
这全都是他一个人做的。他说,兄弟,这本来需要一个200人的经济学家团队花一年时间来完成。他就像是,他完全沉迷于Claude了。他说,一切都变了。
作为一个企业主,你如何看待从接近零到25%、并加速向某个百分比迈进的这个过程——占总支出的比例?我明白。到什么程度你会说,好吧,我需要踩刹车,谨慎考虑我们的花费。也许我们不需要花在最贵的——今天刚发布的Opus 4.7上。也许我可以退回到一个稍微便宜一点的版本。
Dylan Patel:
归根结底,我是做信息行业的,对吧?就是,你知道,我们出售分析,做咨询,创建数据集。我不明白为什么这不会在相当快的速度上被完全商品化。如果我不能持续改进我最初作为数据集出售的核心产品,那就会发生这种情况。实际上,确实是这样,你知道,现在有更多的人在尝试做同样的事情。我们让它不断变得更好、更详细。因此,它仍然有市场。但我们在2023年做事的方式与现在其他人做的方式并没有太大不同。如果我不提高标准,我就会被商品化。如果我移动得不够快,我也会失去优势。所以问题是,是的,AI会将事物商品化,就像它将软件商品化一样。那些能够快速行动、保住客户、持续提供出色服务并持续改进的人,业务不会萎缩,反而会增长得更快。那些固守现状、什么都不做的老牌企业,将会失败。所以这有点像生死存亡的问题——如果我不采用AI,别人会,而他们将会打败我。
Dylan Patel:
另一个简单的例子是能源领域。所以我们有几位能源分析师,大概一年了,我们一直在尝试建立这个能源模型。这非常复杂。能源数据服务市场大概有9亿美元的规模。所以显然是一个我试图打入的巨大市场。但是,你知道,尽管团队里有多人花了一年时间,我们真的没能打入能源数据服务业务。然后"Claude Code狂热症"击中了半导体分析公司负责数据中心、能源和工业业务的Jeremy。突然之间,在三周内,他花了很多。他每天花大约6000美元。这是一个疯狂的数字。但他抓取了美国每一座发电厂、每一条超过特定电压的输电线路,并创建了对整个美国电网的完整映射,以及大量需求来源,所有数据都来自各种公开数据源。我们展示了它,它有一个仪表盘,你可以查看和检查。你可以看到美国所有微区域的电力短缺和盈余,以及所有这些细节。
Dylan Patel:
在几周内就建成了。我们开始向一些购买我们数据中心数据集的客户展示,但也向一些能源交易员展示,他们看到后说,哇,这花了你多长时间?这真的很好。这比XYZ公司的产品还要好。然后我们深入挖掘。XYZ公司有100个人,已经在这上面工作了十年。显然,我们的产品没有那么完善、那么健壮,但在某些方面它确实更好。我要去商品化这些能源服务公司、数据服务公司——谁又会来商品化我,如果我移动得不够快的话?所以从企业主的角度来看,问题是,是的,我花了很多,但这些花费给我带来了什么?它带来了更多收入吗?


