GTC大会落幕,AI界期待落空?华尔街日报

3/17/2026

GTC大会内容对产业链公司的影响更多,但英伟达自身的增量信息并不多,比如市场关心的资本开支持续性,英伟达的市场份额。此外,大会指引平淡,黄仁勋预测“至2027年数据中心累计收入达到1万亿美元以上”,这个数字可能不及市场预期。

2026年3月16日,英伟达创始人兼CEO黄仁勋在GTC 2026大会上发表主题演讲,核心议题涵盖CUDA平台20周年、推理拐点与算力需求爆发、Vera Rubin系统架构、Groq集成、OpenClaw代理革命及物理AI与机器人。

一、GTC2026核心要点

1)数据中心营收展望:2025-2027年数据中心累计收入达到1万亿美元(去年GTC大会给的是2025-2026年累计收入5000亿美元),符合预期。市场主流预期本身已经提升至1万亿美元以上,更期待的是公司能给出明确订单等方面的信息。

2)性能和成本:在tokens/watt(吞吐量)和token速度(智能度)两个维度上,英伟达均为全球最高性能;英伟达的token成本全球最低。

3)数据中心成为"token工厂":每个工厂受限于功率(如1GW),需要管理token生产的吞吐量和速度。

token将像大宗商品一样细分层级:免费层(高吞吐、低速度)->$3/百万token层->$6/百万token层->$45/百万token层->$150/百万token层(顶级低延迟、高带宽算力)。

以1GW数据中心为例,每25%功率分配一个层级:Grace Blackwell可比Hopper生成5倍收入,Vera Rubin可再提升5倍。

4)Vera Rubin:在此前6类芯片基础上,新增了Groq 3 LPU。

①Vera Rubin:100%液冷(45°C热水冷却),所有线缆取消,安装时间从两天缩短至两小时;

②CPO(共封装光学)Spectrum-X交换机:已全面量产,与TSMC共同研发;

③CPU:世界上唯一使用LPDDR5的数据中心CPU,独立售卖,将成为数十亿美元级业务;

Vera CPU Tray用于Agentic workload, 单个Vera Compute Tray集成了8颗Vera处理器, 每个处理器88核, 同时支持8通道的LPDDR5x内存, 单个socket支持1.2TB/s的内存带宽。CPU Tray上集成了2块BF4-DPU。

④Vera Rubin:已在Microsoft Azure上线运行(第一个rack)。英伟达供应链已可每周生产数千套系统,每月数GW级AI工厂产能;

⑤Rubin Ultra:Rubin是横向滑入机柜,Rubin Ultra要垂直放入新机架Kyber,其中144 GPU在一个NVLink域内,中板后方用NVLink交换机替代铜缆。

5)Groq 3 LPU(新增芯片):Groq和HBM并用,符合预期

技术来自于收购的Groq团队,Groq LP30由三星制造,预计三季度发货。

单颗Groq芯片500MB SRAM vs 单颗Rubin芯片288GB,Groq单独无法承载主流大模型的参数和KV Cache。

解决方案:推出了一个Dynamo软件,把推理步骤分解出来:

1. 预填充阶段:也称Prefill,也是模型批量处理用户输入的Prompt的阶段,主要是以计算为主,因此在Vera Rubin上完成;

2. 解码的注意力环节:主要是计算当前产生的token与历史tokens(KV Cache,对话存储的记忆)的关系,是计算和存储并重的工作性质,也是在Vera Rubin上完成,频繁读取Rubin上的HBM内存单元。

3. 解码的前馈网络(FNN):在Attention环节确定上下文关系后,前馈网络负责基于前Token来输出下一个Token的概率分布,并选出下一Token,即“吐字”。

这个环节的每一层都要读取模型的权重参数,读一次只能处理一个Token,原本参数放在HBM中,计算单元一直在等着数据从HBM搬运过来,这也是“内存墙”的真正堵点。

把解码分成用软件拆出两个阶段后,等于把模型在工作的“上下文记忆”仍然保留在HBM上,但把大部分模型参数转移到了Groq的SRAM上,芯片上内嵌的存储层SRAM能够以极低的延迟读取这些权重参数,从而解决推理吐字慢的问题。

Rubin和Groq之间用以太网紧密耦合,RDMA特殊连接模式可以让两芯片之间的交互延迟降低约一半。

6)Feynman:全新GPU + LP40(LPU)+ Rosa CPU(以Rosalind命名)+ BlueField-5 + CX10。

Kyber铜缆scale-up + Kyber CPO scale-up(首次同时支持铜缆和CPO scale-up)。这意味即使在Feynman阶段,也将同时支持铜和CPO的混合方式。

虽然英伟达长期看好CPO方案,但客户方面倾向于将铜缆方案用到极致后再切换CPO(部署/维护更简单)。

7)其他信息:

①太空数据中心:针对能源不足问题,英伟达宣布Vera Rubin Space-1,计划将数据中心部署到太空(需解决辐射散热问题,太空中无传导和对流,仅有辐射);

②OpenClaw:每家SaaS公司将变成GaaS公司(Agent-as-a-Service)。

代理系统在企业网络中可以访问敏感信息、执行代码、对外通信——这需要企业级安全。英伟达与OpenClaw创始人Peter Steinberger合作推出NemoClaw(OpenClaw的企业安全参考设计),集成OpenShell技术,包含网络护栏(network guardrail)和隐私路由器(privacy router),可连接各SaaS公司的策略引擎;

③物理AI与机器人:自动驾驶方面, 比亚迪/吉利/现代/日产等厂家加入Robtaxi, 并与Uber合作。然后机器人方面KUKA/ABB等厂商, 还有很多机器人/无人机平台等。

总体来说,这次发布会,除了澄清了铜缆和CPO会并用,主要就是新加入了一个服务器中新加入了Groq的LPU选项。这个在Groq被买后,市场已有充分预期;甚至指引的三年一万亿美金收入,市场实际其实也已经超过这个数字了。

Scroll for more