英伟达提前量产下一代芯片 AI竞赛加速出击!英伟达2026年的首场重头戏比以往来得更早。当地时间1月5日,在美国CES上,黄仁勋出乎意料地提前发布了下一代AI芯片平台“Rubin”,打破了英伟达通常在每年3月GTC大会上集中公布新一代架构的传统。

AI竞赛进入推理时代,英伟达决定加速出击。早在2025年3月的GTC大会上,黄仁勋就已预告了代号“Vera Rubin”的超级芯片,并明确其将于2026年量产。此次在CES上,黄仁勋对Rubin平台进行了系统性发布,Rubin成为英伟达最新GPU的代号。
黄仁勋表示,Rubin的到来正逢其时,无论是训练还是推理,AI对计算的需求都在急剧攀升。通过六颗全新芯片的极致协同设计,Rubin正在向AI的下一个前沿迈出巨大一步。Rubin平台采用极端协同设计理念,整合了6颗芯片,包括NVIDIA Vera CPU、Rubin GPU、NVLink 6交换芯片、ConnectX-9 SuperNIC、BlueField-4 DPU以及Spectrum-6以太网交换芯片,覆盖了从计算、网络到存储与安全的多个层级。
相比前代Blackwell架构,Rubin加速器在AI训练性能上提升3.5倍,运行性能提升5倍,并配备拥有88个核心的新款中央处理器(CPU)。相比英伟达Blackwell平台,Rubin平台实现推理token成本最高可降低10倍,训练MoE(专家混合)模型所需GPU数量减少4倍。
与此同时,Vera Rubin NVL72机柜级系统和平台同步发布。英伟达高管指出,NVL72指的是72个GPU封装单元,每个封装内部包含2个Rubin Die,因此系统中实际包含144个Rubin Die,这并不意味着系统规模变化。
在生态层面,Rubin已获得头部云厂商和模型公司的集中响应。AWS、Microsoft、Google、OpenAI、Anthropic、Meta、xAI、CoreWeave等均被列入首批采用名单。此次在CES上提前披露Rubin,主要是为了尽早向生态伙伴提供工程样品,方便其为后续部署和规模化应用做准备。英伟达强调,Rubin仍将按照既定节奏推进,计划在今年下半年进入量产爬坡阶段,这一时间安排与此前披露的路线图保持一致。




