黄仁勋首次抛出英伟达极简定义华尔街日报
“输入是电子,输出是Token,中间是英伟达。”黄仁勋首次抛出英伟达的极简定义,并以此为核心阐释了公司的供应链护城河、对TPU竞争的不屑、坚持不自己做云服务的哲学。他强调,英伟达提供的是覆盖全科学领域的加速计算平台,其成本优势在于最优的TCO(总拥有成本)与每瓦特Token产出。他表示,绝不对GPU进行“价高者得”的竞价售卖,也不会放弃中国市场。
英伟达CEO黄仁勋用一句话定义了自己的公司:输入是电子,输出是Token,中间是英伟达。
4月15日,英伟达CEO黄仁勋接受播客主持人Dwarkesh Patel的深度访谈,内容涵盖英伟达的供应链护城河、TPU竞争威胁,以及英伟达为何不自己做云服务等问题。
英伟达:“电子”—“Token”转换器
访谈开篇,主持人提出了一个尖锐问题:英伟达本质上只是写软件,芯片由台积电制造,内存由SK 海力士、美光、三星提供,封装由台湾ODM厂商完成——如果软件被商品化,英伟达会不会也被商品化?
黄仁勋给出了他对英伟达最精炼的定义:
最终,需要有某个东西把电子转化成Token。把电子转化成Token,并且让这些Token随时间变得更有价值,这件事很难被完全商品化。
他进一步说:“输入是电子,输出是Token,中间是英伟达。我们的工作是尽可能高效地完成这一转化。”
在供应链层面,外界关注的焦点是英伟达的采购承诺规模——最新财报显示接近1000亿美元,行业分析机构SemiAnalysis预测这一数字未来可能达到2500亿美元。黄仁勋解释了这背后的逻辑:
如果未来几年是万亿美元规模,我们的供应链能支撑它。
他说,这种能力并非单纯来自合同,而来自对上游CEO的持续“告知、激励和对齐”——让他们看清AI产业的规模和方向,然后愿意为英伟达的需求进行投资。CoWoS封装是典型案例:两年前是全行业最紧缺的瓶颈,英伟达“连续几个翻倍”地扩产之后,现在已基本不再是话题。
他判断,供应链上的任何瓶颈都不会持续超过两三年:“EUV机器、逻辑产能、封装——这些东西都不难复制,只需要需求信号。”他认为真正的长期制约在下游:能源政策。“你不能在没有电力的情况下建立一个工业,这才是需要时间的事情。”
TPU竞争:英伟达的计算栈是全球最佳性价比
云巨头(Hyperscalers)贡献了英伟达约60%的收入,但谷歌、亚马逊、甚至OpenAI等大客户都在加码自研TPU或其他ASIC芯片,这直接质疑英伟达的竞争地位。
黄仁勋的回应分两层。
第一层是定性区分:英伟达做的是“加速计算”,而不是专用张量处理单元。加速计算覆盖分子动力学、流体力学、数据处理、量子计算等几乎所有科学计算领域,远比AI更宽。
我们是唯一一家加速所有类型应用的公司。
第二层,黄仁勋称,球没有任何一个平台的性能和总拥有成本能优于英伟达,谷歌TPU、亚马逊Trainium都无法与之匹敌,我并不认可Trainium所宣称的40%成本优势。英伟达毛利率能达到70%,而ASIC芯片毛利率约为65%,企业替换产品并不能实现显著的成本节省。
英伟达的计算栈是全球最佳性价比,没有例外。没有一家公司能向我证明,今天世界上有任何平台的AI数据中心的总拥有成本(TCO)比我们更好。没有。Dylan的InferenceMAX摆在那里供所有人用,TPU不来,Trainium不来。
对于Anthropic大量使用TPU的问题,黄仁勋直接回应:
Anthropic是一个特例,不是趋势。没有Anthropic,TPU的增长从哪里来?是100%来自Anthropic。没有Anthropic,Trainium的增长从哪里来?也是100%来自Anthropic。
他也坦承,早年未能及时向Anthropic进行战略投资是自己的判断失误:
当时谷歌和亚马逊AWS投入了大量资金,Anthropic因此使用了他们的算力。我当时没有深刻意识到,风投根本不可能给一家AI实验室投50亿、100亿美元。这是我的失误。但我不会再犯同样的错误。
目前,黄仁勋已分别对OpenAI和Anthropic进行了大规模投资,据报道金额分别高达300亿和100亿美元。
为什么不自己做云?“尽可能少做”是哲学
手握巨额现金流,英伟达近期频频向CoreWeave等初创云服务商提供资金和算力支持。市场猜测,英伟达是否会越过客户,亲自下场做超大规模云服务商,收取算力租用费?
黄仁勋的回答涉及公司哲学:
我们应该做尽可能必要的事,做尽可能少的事。我们做的这些事,如果我们不做,我真的相信它们就不会发生。但云服务?如果我不做,有人会来做的。
他举了CoreWeave、Nscale、Nebius等“新云”作为例子——这些公司若没有英伟达的早期投资和支持,根本不会存在。但英伟达的介入是“让生态繁荣”,而不是转行做金融租赁或云计算运营。
他对于“不挑赢家”也有明确表态:“当我投资其中一家,我会投资所有家。”理由是:英伟达自己当年在60家3D图形公司中几乎是被公认“最不可能活下来”的一家,“我有足够的谦逊来认识到这一点”。
坚守卖铲人定位,GPU分配绝不搞“价高者得”
在供需极度失衡的背景下,英伟达如何分配紧俏的GPU?黄仁勋明确否认了“价高者得”的市场传闻。
我们绝不会那样做,这是糟糕的商业行为。你定好价格,然后人们决定是否购买。
黄仁勋解释了英伟达的分配逻辑:优先考察客户的排产预测和采购订单(PO),其次看客户数据中心的就绪程度,最终遵循先到先得的原则。“我更希望成为行业可靠的基石。如果你下达了1000亿美元的AI工厂订单,没问题,全世界只有我们能给你这种确定性承诺。”
不会放弃全球第二大市场
针对当前的芯片出口管制,黄仁勋从商业与技术标准的角度表达了务实的看法。
他指出,算力只是AI产业的底层输入,当受到约束时,竞争对手可以通过堆叠更多能源、使用更多上一代芯片,以及优化算法来弥补硬件代差。
他表示,首先要认识到:中国并不缺芯片。他们拥有全球顶尖的计算机科学家,众所周知,这些AI实验室里的AI研究人员有相当大比例是中国人。他们拥有全球约50%的AI研究人员。
他们是竞争对手,我们希望美国胜出,但我认为进行对话和研究交流可能是最安全的做法。放弃整个市场不会让美国长期在技术竞赛中在芯片层、计算堆栈中获胜。这是一个事实。
CUDA生态系统与飞轮效应
英伟达的核心竞争壁垒就是成熟的开发者生态,GPU全球装机量达到数亿级别,应用场景实现全面覆盖。
行业发展飞轮效应清晰,依靠最大的装机量、可编程的架构、丰富的生态体系以及全球海量的AI公司,形成强劲发展动力。再加上性价比、能效、客户基数均处于全球领先地位,进一步推动发展飞轮持续运转。
架构优势与产品路线图
黄仁勋表示,传统摩尔定律每年性能增长约25%,想要实现10到100倍的性能飞跃,必须依靠算法与计算架构的双重革新。Blackwell架构的能效相比Hopper架构提升50倍,这一成果绝非单纯依靠晶体管进步就能实现,架构优化与计算机科学创新才是核心关键。该架构支持全流程可编程以及全栈协同设计,依托NVLink、Spectrum-X技术实现,没有CUDA生态根本无法完成。对于产品路线图与发布节奏。黄仁勋透露,英伟达产品会保持年度稳定迭代,从Vera Rubin到Vera Rubin Ultra,再到Feynman,每年都会推出稳定升级的新品。同时我们是全球唯一一家,能够承接从1000万美元到1000亿美元任意规模AI算力订单的企业。
访谈文字实录(略有删减)
(00:00:00) 英伟达最大的护城河,是否在于对稀缺供应链的掌控?
(00:16:25) TPU能否打破英伟达对AI算力的垄断?
(00:41:06) 英伟达为何不转型为超大规模云服务商?
(01:35:06) 英伟达为何不同时开发多种不同的芯片架构?
00:00:00——英伟达最大的护城河,是否在于对稀缺供应链的掌控?
Dwarkesh Patel
我们看到许多软件公司的估值大幅下跌,因为人们预期AI将使软件商品化。有一种可能过于简单的看法是:英伟达把GDS2文件发给台积电,台积电制造逻辑芯片和交换机,再与SK海力士、美光和三星生产的HBM一起封装,然后发往台湾的ODM厂商组装成机架。英伟达本质上是在做软件,而制造由他人完成。如果软件被商品化,英伟达是否也会被商品化?
Jensen Huang
归根结底,总需要有某种东西把电子转化为Token。将电子转化为Token,并持续提升Token的价值,这件事很难被彻底商品化。这个转化过程本身就是一段了不起的旅程——让这个Token变得有价值,就像让一个分子比另一个分子更珍贵,让一个Token比另一个Token更珍贵。其中涉及的艺术性、工程智慧、科学原理和创新发明,我们正在实时见证这一切的发生。这个转化过程、这套制造体系、所有的科学积累,远未被深刻理解,这段旅程也远未结束。我不认为商品化会发生。


