半导体行业正迎来史无前例的“超级周期”华尔街日报
Bernstein明星分析师Stacy Rasgon认为,在AI基础设施投资逼近美国GDP 4.4%的狂飙突进下,半导体行业正迎来史无前例的真实“超级周期”。
6月21日,聚焦新兴科技前沿的播客Tech Surge Deep Tech Podcast发布最新访谈实录,Celesta Capital创始管理合伙人Michael Marks与伯恩斯坦(Bernstein)知名芯片分析师Stacy Rasgon进行了一场深度对谈。
在长达近一小时的对话中,双方深入探讨了AI驱动下的半导体营收增速、AI从训练到推理的跨越、供应链各环节的产能瓶颈,以及行业未来增长的可持续性空间。
(左:Michael Marks;右:Stacy Rasgon)
与大多数华尔街分析师不同,Rasgon拥有麻省理工学院博士学位,是纯正的工程师出身,这使得他更看重成熟的物理定律和资本流动。
Rasgon明确指出,当前半导体行业正在经历一场他从业以来见过的最大规模的需求大爆发。去年,半导体行业总营收突破了8000亿美元,而今年正在向1.3万亿美元的规模狂奔。
Rasgon在访谈中感叹:
在我的整个职业生涯中,我一直听到‘超级周期’这个词。而这可能是我真正见过的第一个。我们现在听到的唯一声音就是,没有人的算力是够用的。
Rasgon强调,当前市场焦点正从“模型训练”向“AI推理”转移,这是实现商业化变现的核心。同时,产能瓶颈正从GPU向HBM存储、半导体设备乃至电力供应全面蔓延。
未来,博通代表的定制芯片(ASIC)与英伟达的GPU将在日益扩大的增量市场中长期共存,共同消化这波深不见底的算力需求。
供应链的“打地鼠”游戏,全行业正被AI强行拉动
随着AI算力需求的无底洞被打开,市场正呈现出一种奇特的“打地鼠”效应——产能瓶颈正在产业链上逐个爆发。
Rasgon详细拆解了这一现象:
一切都在被这种对AI算力贪得无厌的需求所拖动。在我的职业生涯中,从未见过如此规模的景象,情况从加速器蔓延到存储,再到半导体制造设备、网络和光学器件、功率半导体,现在甚至连CPU也供不应求。
以存储器为例,行业正在经历有史以来最强劲的上升周期,价格每季度都在翻倍。这背后的核心推手是HBM(高带宽存储)。Rasgon透露了一个关键的数据细节:
在一个AI芯片的硅片面积中,可能有85%以上都是HBM。
更关键的是“折算率(trade ratio)”问题。他说:
由于堆叠技术的良率损耗和逻辑裸片空间的占用,制造1GB的高带宽存储,大约需要4倍于标准DRAM的硅片面积。
这意味着即便晶圆厂疯狂扩产,实际产出的存储容量(比特数)增量依然十分受限。
这种极端的需求甚至让处于弱势的企业也意外获益。谈及英特尔的服务器CPU业务时,Rasgon直言不讳地指出,当前的服务器需求异常强劲,以至于英特尔甚至因此获得了利润率的上行:
需求太强劲了,以至于他们甚至把以前注销过、像垃圾一样扔在仓库角落里的库存都卖掉了。客户现在的态度是:‘我们不在乎,我们要了,请卖给我们吧。’
拐点来临:“你无法靠训练模型赚到任何钱”
尽管千亿美元级别的资金正在涌入,但市场最大的担忧在于:这种增长可持续吗?想象空间到底在哪?
Rasgon将破局点直指“推理(Inference)”。他强调,大量的资金此前用于大模型训练,但这并非商业化的终局。Rasgon表示:
你无法靠训练模型赚到任何钱……你必须能把模型用起来,这就是推理。
这种转变已经开始体现在初创公司的惊人数据上。Rasgon在访谈中援引数据称,类似Anthropic这样的公司,其年化收入运行速率呈现出垂直上升的态势,
去年12月是90亿美元,今年1月达到140亿美元,而在近期(4月)已经达到了300亿美元。
此外,随着英伟达近期收购Groq,推理市场的细分需求正在凸显。Rasgon指出,并非所有的数据“词元”都具备相同的价值。
对于需要极低延迟、极快响应的特定推理任务,定制化的芯片或专用的推理架构往往比通用GPU具有更好的经济性。
定制ASIC与GPU不是零和游戏
在推理需求爆发的背景下,定制化芯片(ASIC)的势头正在冲击GPU的绝对垄断。博通成为了这一趋势的最大受益者。
Rasgon在提及博通时表示:
在这一切开始之前,博通曾说半导体是一个成熟行业,只有中等个位数的增长。但现在一切都爆炸了。(博通)他们说,明年他们认为能在AI收入上做到1000亿美元。
各大云服务商为何执着于自研ASIC?Rasgon认为这不仅是出于性能优化,更是为了在英伟达高达75%的毛利率面前拥有谈判筹码。Rasgon说:
至少当你坐在谈判桌前和黄仁勋谈判明年的合同时,你会希望口袋里有点底牌。
但Rasgon强调,这并非谁取代谁的游戏。如果ASIC占据更大的份额,那是因为整个蛋糕变大了。
对于庞大、稳定且内部开发的工作负载,ASIC能提供更低的总拥有成本;但如果模型结构改变,GPU的可编程性优势则不可替代。Rasgon认为:
正确的痛点在于:摆在我们面前的机会是不是还在变大?如果足够大,他们两者都会蓬勃发展;如果不大了,那大家都要完蛋。
未来的终极天花板:电网可能支撑不住
当被问及市场可能忽视的风险时,Rasgon将焦点从代码和硅片拉回到了现实世界的物理基础设施——电力。
目前,云巨头们今年的资本支出已达6000亿美元,如果未来基础设施支出按照英伟达预期的每年3万亿到4万亿美元规模发展,人类现有的能源系统将面临崩盘。
Rasgon分享了他此前建立的一个测算模型:
我们到底有没有足够的电力来做这件事?电网可能承受不了。美国的电力容量需要在未来十年内每年增长5%左右。而在电力设备分析师的眼里,5%的年增长率是根本无法实现的。
这意味着,下一波AI的创新和瓶颈突破口,将不可避免地落在能源生成、冷却和核电等领域。正如他一直坚信的:
永远不要低估人类的聪明才智,如果有利可图,工程师们总会找到出路。
总体而言,只要AI的需求不发生断崖式崩盘,整个半导体产业链的“超级周期”仍将持续,而资本市场的关注点,必须紧跟这些不断在各个环节中游走的“产能瓶颈”。
以下为播客全文(AI辅助翻译):
Michael Marks: 有一个词在芯片行业每隔几年就会被抛出来——超级周期。大多数时候,它都被过度渲染。偶尔,它是真实的。眼下,这些数字难以反驳:四大云计算巨头今年的支出预计将达到约6000亿美元,其中大部分用于AI基础设施。半导体行业去年营收突破8000亿美元,正向1.3万亿美元迈进。
今天我的嘉宾是Stacy Rasgon,他是伯恩斯坦(Bernstein)知名的芯片行业分析师。与华尔街大多数分析师不同,他是工程师出身——麻省理工学院博士,在写第一篇分析报告之前,曾实际参与过芯片制造设备的研发。这一背景深刻影响了他解读行业的方式:少一些投机,多一些对已被验证的物理规律和资本流向的关注。
今天我们将深入探讨:AI周期是否真的有所不同?瓶颈在哪里?尘埃落定后,谁能攫取利润?
Michael Marks: AI正在驱动如此巨大的数字体量,而且始终是新闻焦点,这在以前从未有过。这是真正的变化,还是只是另一个更大版本的周期而已?
Stacy Rasgon: 这确实是关键问题。说来有趣,在我整个职业生涯中,"超级周期"这个词我已经听了无数遍了,但也许这是我真正亲眼见证的第一次。
半导体周期有几种不同类型:
供给周期: 在内存领域最为常见。供应趋紧,价格上涨,于是大量产能上马。但随后产能落地,需求却已下滑——因为客户在拿不到想要的零部件时,往往会超量下单,导致供需严重错位。这类周期通常持续4年左右,从峰值到谷底。
库存周期: 半导体处于供应链末端,需求的微小波动会沿供应链逐级放大。需求一旦下滑,客户就减少采购,消化自身库存,半导体出货量随之低于实际需求;而当客户开始补库存时,出货量又会超过实际需求。这类周期往往体现为季度性的起伏,大约持续几个季度。
产品周期: 比如我是一家移动端半导体供应商,能否赢得下一代iPhone的供货资格,直接决定了收入的大幅波动。
而我们眼下正在经历的,似乎是一个需求周期,而且我从未见过规模如此之大的。无论是量级还是速度,都是前所未有的。
更值得关注的是,AI半导体的爆发已经开始拉动整个行业。几乎所有半导体细分领域,无论是股价还是盈利,都在向好发展。这波需求的传导路径清晰可见:从加速器,到内存,到半导体设备,到网络和光通信,再到电源半导体,直至现在的CPU——一切都被对AI算力那种近乎贪婪的需求拖着走。
目前我们听到的唯一共识就是:没有人拥有足够的算力。
Michael Marks: 内存一直是典型的周期性半导体产品。现在内存厂商需求旺盛、长期售罄——这种局面能持续多年吗?况且市场上几乎没有新进入者,产能就这么多。
Stacy Rasgon: 我们来聊聊内存——这可能是历史上最强劲的内存周期。要知道,仅仅18个月前,我们还深陷可能是自互联网泡沫以来最糟糕的内存寒冬。
你提到入局者减少,确实如此。回溯20到30年前,内存厂商多达30家;而如今,根据内存类型的不同,只剩下3到6家。上一个寒冬里,这些厂商虽然亏损,但尚能支撑;回到互联网泡沫时代,却出现了大规模破产。如今的行业格局比那时更为健康稳固。
目前,内存价格已经出现每季度翻倍的情况,需求火爆,根本原因正是AI。
这里有必要区分两大主要内存类型——DRAM(动态随机存取内存)和NAND(闪存):
▪︎ DRAM 类似PC里的内存条,负责运行系统;
▪︎ NAND 类似手机里的存储芯片,用于保存照片等数据。
在DRAM领域,有一些格外值得关注的动态。AI芯片大量使用一种特殊的DRAM——HBM(高带宽内存)。它将多颗DRAM芯片垂直堆叠封装在一起,每颗AI芯片都需要配置大量这类内存封装。
如果统计一颗AI芯片所有部件的硅片面积,HBM占比可能高达85%以上。
更重要的是,制造HBM存在所谓的**"转换比率"问题:由于堆叠工艺导致良率下降,加上需要预留连接器空间,制造同等容量的HBM所需的硅片面积,大约是普通DRAM的四倍**。这意味着,即便大量扩充晶圆产能,实际能新增的存储容量也相当有限。
只要AI需求持续增长,这一局面应该不会改变。而如果AI需求真的崩了,那大家都完了,所以这个场景不在我的担忧范围内——目前也没有任何迹象显示会走到那一步。
Michael Marks: 你关注这个行业已经很长时间了,技术创新能随着时间推移缓解供应压力吗?还是说需求实在太强劲,任何创新都无济于事?
Stacy Rasgon: 创新永远都在发生。过去60年里,半导体行业有一条主线叫做摩尔定律——每两年,在相同面积的硅片上可以塞入约两倍数量的晶体管,而成本却基本不变。换句话说,你每隔两年就能用同样的价格获得两倍的算力,或者以一半的成本获得同等算力,同时性能提升、功耗降低——堪称美妙。
然而,摩尔定律在十多年前开始瓦解。这并不意味着技术进步的终结,但它意味着成本优势这条腿从原本的"三腿凳"上抽走了。我们仍然能获得性能和功耗方面的提升,但现在你必须为此买单。每个晶体管的成本不再下降,而是开始上升——这是全新的局面。
当时,很多人担心这将是行业的终结。但事实恰恰相反,它开启了行业的文艺复兴。因为它意味着:如果你想要更好的性能,你需要付钱,而不是等着行业免费奉送。
我记得博通的前联合创始人、时任CTO Henry Samueli,大约在2012年就谈到这个问题。他展示了台积电每晶体管成本的走势,指出成本在28纳米节点触底。他的核心观点是:这不是坏事,这是整个行业40年来头一次走向理性。
摩尔定律终结之后,创新并未停止,只是转移了方向:
▪︎ 新型晶体管结构: 全新的器件架构持续演进;
▪︎ Chiplet架构: 将芯片拆分成多个小芯片,分别针对不同功能采用最优化的工艺,再通过先进封装技术整合在一起,突破单块芯片约830平方毫米的"掩膜极限";
▪︎ 先进封装: 比如英伟达的Blackwell GPU,实际上是两颗GPU芯片叠加,再搭配大量HBM通过硅中介层(silicon interposer)集成在一起,可以堆叠出更大的硅片面积和更强的算力。
这些方案当然不便宜,但只要客户有足够的理由为此买单,他们就会愿意付费——这也是英伟达能维持75%毛利率的根本原因。
Michael Marks: 如果这一切开始以某种方式放缓,我们会看到什么信号?
Stacy Rasgon: 我们重点关注几个指标:


