AI供应链全线紧绷,价格齐涨华尔街日报
SemiAnalysis指出,需求爆发推动算力告急,内存、GPU到AI服务器价格飙升且有价无市,H100 GPU年租价五个月内飙升40%。该机构认为,GPU租赁价格短期内大概率继续上涨。Neocloud开始掌握议价主动权,但CoreWeave、IREN等相关公司股价却尚未反映这一变化。
AI算力需求的爆炸式增长正将整个供应链推向极限。从GPU租赁到DRAM内存,从光纤电缆到数据中心托管,价格在短短数月内全线飙升,而供给却几乎无处可寻。
据研究机构SemiAnalysis最新报告,H100 GPU一年期租约合同价格已从2025年10月的低点每小时每GPU 1.70美元急升至2026年3月的2.35美元,涨幅接近40%。与此同时,按需算力已在所有GPU型号上全线售罄。
此轮算力短缺的核心驱动力来自需求端的结构性跃升。Anthropic的年度经常性收入(ARR)在单季度内从90亿美元飙升至超过250亿美元,Claude Code等多智能体工作负载正在推动算力消耗呈抛物线式增长。
SemiAnalysis认为,GPU租赁价格短期内大概率继续上涨。Neocloud开始掌握议价主动权,但CoreWeave、Nebius、IREN等相关公司股价却没有反映出这一变化。
需求端:多点爆发,算力消耗呈抛物线式增长
本轮算力短缺的需求侧动能来自多个相互叠加的方向。
Claude Code的爆发是最显著的拐点。Anthropic的ARR在一个季度内从90亿美元暴涨至超过250亿美元,三倍于前。GLM、Kimi K2.5等开源模型的走红进一步拉动了推理工作负载的规模。
与此同时,Anthropic、OpenAI等AI实验室的大规模融资本身也直接创造了GPU需求。
AI代理是另一重要推手。这类工作负载以高并发方式执行多步骤工作流、持续迭代,导致算力消耗呈抛物线式上升。
原生媒体生成平台Seedance和Nano Banana推动了图像与视频生成场景下的海量算力需求。
从经济学角度看,这一需求具备相当的价格不弹性。SemiAnalysis指出,如果AI工具的投资回报率达到5至10倍,GPU租赁价格还有相当大的上升空间才会抑制需求。
"需求曲线向右上方移动,提供了一种强劲且相对缺乏弹性的力量,推动GPU租赁价格上涨。"
供给端:内存价格暴涨,服务器采购陷入混乱
需求爆发只是算力短缺的一面,供给端价格暴涨是另外一面。
2026年1月成为另一个关键拐点。彼时DRAM和NAND内存价格上涨加速。据SemiAnalysis内存模型估算,LPDDR5和DDR5合同价格在2026年第一季度的同比涨幅分别趋向约4倍和5倍。
内存价格的暴涨迅速传导至服务器整机端。原始设备制造商(OEM)对AI服务器重新定价,但其涨幅显著超出元器件成本的实际上升幅度。
更高的服务器采购成本压缩了项目预期回报,迫使部分运营商放缓甚至搁置新部署计划。换言之,原本将进入市场的供给被迫滞后,进一步收紧了租赁市场。
Blackwell新一代GPU的供给状况同样不容乐观。据SemiAnalysis了解,Blackwell新集群的部署交期目前已延伸至2026年6至7月,开源权重模型的强劲需求和持续的推理算力短缺是主因。
市场结构:Neocloud掌握议价主动权,合约条款全面收紧
GPU租赁市场的权力格局在六个月内发生了根本性转变。
在2025年下半年之前,市场竞争激烈,多家Neocloud争相压价,以确保资产利用率。
而如今,Neocloud和超大规模云厂商(Hyperscaler)已完全掌握主动——他们不仅可以争取更高的预付款比例、更优的定价和更长的合约期限,还可以根据自身库存情况灵活安排合约起止时间。
GPU租赁市场可分为三个主要层级:
短期租赁(按需、现货及3个月以下合约):通常为剩余产能,当前此类容量已全线售罄,持有者即便面临价格大幅上涨也不愿将容量归还市场。
中期合约(3个月至3年以上):市场成交最为活跃的区间。其中一年期合约能够捕捉非AI实验室客户的边际需求,是反映市场紧张程度的最敏感指标。
长期大宗协议(4至5年):主要由大型AI实验室主导,单笔交易规模通常达到50至100兆瓦甚至更大,相当于约24,000至48,000块GB300 NVL72 GPU。
这类交易对Neocloud而言极具吸引力——凭借长期合约可安排有利的债务融资,锁定两位数的项目内部收益率(IRR),同时规避GPU价格风险。超大规模云厂商有时会在此类交易中充当担保方,进一步降低融资成本。
价格展望:自我强化的螺旋,Neocloud估值却遭低估
SemiAnalysis认为,GPU租赁价格短期内继续上涨的可能性远大于下跌。
当前动态具有明显的自我强化特征:供给收紧推动价格上涨,价格上涨促使Neocloud加速锁定硬件,进一步收紧供给,价格随之再次上涨。
SemiAnalysis将此与2023至2024年的GPU短缺周期相提并论,但认为此次服务器市场已足够成熟,OEM获取超额利润的空间可能受限。
租价上涨对Neocloud的财务影响是双重的:一方面,已部署资本的利润率得以扩张,改善投资资本回报率(ROIC);另一方面,更高的租赁价格延长了现有GPU的经济使用寿命,使既有资产在需要再投资之前能够产生更长时间的现金流。
在当前环境下,SemiAnalysis认为受益最为明显的Neocloud具备以下特征:合约期限较短(可更快重新定价)、拥有大规模H100存量、以及近期有新增产能上线。
然而,这一基本面改善与公开市场情绪之间存在显著背离。CoreWeave、Nebius、IREN等Neocloud上市公司的股价目前仍处于过去6至12个月交易区间的低位。
SemiAnalysis指出,市场仍受"最终供给过剩与商品化"叙事主导,尚未充分反映地面上清晰可见的持续稀缺与定价能力。
三大观察指标:决定价格趋势的关键变量
SemiAnalysis列出了判断GPU租赁价格能否持续高位的三项核心观察指标。
其一,GB300集群的放量节奏。新增算力容量能否缓解当前的算力短缺,还是算力消耗增速将继续超越新增供给——这将决定AI实验室参与4年以下合约市场的程度,进而左右该区间的定价走势。
其二,硅片短缺的恶化程度。SemiAnalysis在此前报告中已指出台积电N3制程逻辑晶圆产能以及HBM、DRAM、NAND存储器的供应紧张状况,复杂的制造流程意味着执行风险随时存在。
其三,AI实验室ARR的增长轨迹。用户采纳速度的快慢以及token消耗的持续增长,是决定整体需求曲线斜率的根本变量。
综合来看,SemiAnalysis的结论清晰:在上述三项指标出现明显转向之前,算力价格的方向只有一个——向上。


