凌晨1点,老黄扔“核弹”AI范儿
一年一度的 CES 来了,和往年一样,我最期待的是英伟达老黄的演讲。
那么今年他还能带来什么重磅吗?
话不多说,直接进正题。
那个穿皮衣的男人没有废话,直接扔出了一枚足以让整个 AI 行业重新洗牌的“终极武器”----Vera Rubin 平台。
为了不浪费大家时间,90 分钟的发布会,我提炼了最核心的 2 个“核弹级”重点,让大家快速了解一下。
01|算力暴涨 5 倍:Vera Rubin 架构有多变态?
老黄这次彻底不装了。
面对 AI 对算力近乎变态的渴求,他给出的方案简单粗暴:推倒重来。
全新的 Vera Rubin 芯片,架构极其激进:1 个 Vera CPU + 2 个 Rubin GPU。
这一改,数据直接吓人:
推理性能:相比上一代(Grace Blackwell)直接暴涨 5 倍。
训练性能:提升 3.5 倍。
能效控制:以前还是风冷液冷混合,现在直接上 100% 全液冷。
图:Vera 和 Rubin 芯片
图:NVIDIA Rubin Boxes
图:Rubin GPU
相比前一代,Vera Rubin 将 token 成本降低了 90%,训练 MoE 模型所需的 GPU 数量减少 4 倍。但光有算力没用,数据传不过去也是白搭。
这也是这次发布会被很多人忽视、但极其重要的升级----网络。
老黄这次掏出了压箱底的宝贝:NVLink 6: 采用了 400G SerDes 技术,速度直接比上一代翻倍。
图:NVLink 6
这意味着 GPU 之间聊天基本没有延迟,所有芯片像连体婴一样工作。
硅光技术(Silicon Photonics): 配合 Spectrum-X 交换机,英伟达终于大规模应用了光互连。
图:Spectrum-X
图:Spectrum X switch
BlueField 4: 现在的 Vera Rubin 计算节点,出厂就标配这块 DPU,专门负责处理那些繁杂的数据搬运工作。
图:Bluefield 4
最离谱的是那个 NVL72 机架。
NVL72 的推理性能将提高 5 倍,训练性能将提高 3.5 倍。
图:NVL72
图:NVL72 系统
老黄在现场透露,这一个柜子里塞进了足足 2 英里(约 3.2 公里) 的铜缆!
这意味着什么?
意味着以前需要盖一座机房才能跑的大模型,现在可能塞进这一个柜子就能搞定。
算力成本将断崖式下跌,AI 的“智商”上限被强行拉高了。
02|物理 AI 的觉醒:这一次,AI 真的走出屏幕了
如果说第一部分的硬件是“秀肌肉”,那这部分才是老黄真正的野心所在:Physical AI(物理 AI)。
什么叫物理 AI?
简单说,就是 AI 不再只是陪你聊天的 ChatGPT,它长了手脚,有了躯体,开始在现实世界里干活了。
这一段老黄展示了一套完整的“造物主”系统。
1. Alpamayo:会思考的“老司机”
以前的自动驾驶,看到红灯停,看到人让,那是“规则”。
但今天发布的 Alpamayo 模型,是真正的思考与推理 AI。
是全球首款具备思考和推理能力的汽车人工智能。
图:Alpamayo


