英伟达Vera Rubin全面投产 性能比上一代提升10倍
全面投产。超级计算机,专为智能体工作负载而设计。以太网机架整合到一个完全集成的系统中。的产品预计将于今年秋季开始发货。
Vera Rubin是什么
2026年6月1日, 英伟达首席执行官黄仁勋, 于台北国际电脑展之上, 宣告新一代AI平台Vera Rubin全面投入生产。这是英伟达截至目前规模最为庞大的POD级平台, 专门为智能体工作负载予以设计。Vera Rubin把五个专用机架整合成为一个巨型的AI超级计算机, 象征着AI基础设施步入一个全新阶段。

和上一代Grace平台相较, Vera Rubin于大规模智能体吞吐量这儿提升了10倍, 此数字表明企业能够同时处理更多繁杂的AI任务, 像训练更大的语言模型或者运行更密集的推理计算这般, 对谷歌、微软、Meta这类科技巨头来讲, 这直接关联到AI产品的迭代速度以及竞争力。
产能和供应链翻倍
黄仁勋透露, Vera Rubin的供应链规模为上一代Grace的两倍, Nvidia为AI市场需求做出判断, 全球企业都在抢购AI处理器, 目前英伟达供应链生态系统中数百家合作伙伴, 正在30多个国家和地区的350多家工厂中迅速生产。
Vera Rubin的生产采用了成熟的开源MGX设计, 这种设计让合作伙伴能够快速部署生产线, 开源设计同定制化方案比起来, 降低了准入门槛, 使得更多中小型制作商也能够参与进去, 这对于缓解当下全球AI芯片短缺问题具备实际意义, 预计在今年秋季首批产品就可以发货。
五大系统整合成一个平台

有着五个核心组件的Vera Rubin平台, 其中包括Vera Rubin NVL72系统, 还有Vera CPU, 并含有Groq 3 LPX, 并且有Vera-4 STX存储、再者有-6 SPX以太网机架。这相互关联的五个系统, 被整合进一个完全集成的POD之中, 进而形成了一套端到端的AI计算解决方案。如此一来, 企业就不再需要自行拼凑来自不同供应商的硬件了, 从而降低了系统集成的技术门槛。
这种一体化设计最为突出的益处是性能得以优化, 所有的组件都针对AI工作负载展开过协同调优, 数据传输延迟更为低下, 计算效率更为高效, 对于那些要处理海量数据的AI工厂而言, 这意味着训练速度更为迅速以及运营成本更为低些。
目标客户是谁

Vera Rubin的目标用户群体以内大型的云服务提供商以及AI企业为主, 亚马逊AWS、微软Azure、谷歌云等行业巨头作为首批采购者, 有着持续扩充AI数据中心的需求, 与此同时, 自动驾驶相关企业、专注生物制药研发的机构、从事金融量化交易的团队也属于潜在用户的范畴, 这些领域对于实时推理以及模型训练有着迫切需求。
对中小企业来讲, Vera Rubin兴许太过昂贵且庞大, 然而英伟达借由MGX开源设计, 致使云服务商能够以更低成本去采购以及部署, 最终中小企业能够借助租用云算力来运用Vera Rubin的能力, 无需自行购买硬件, 此模式降低了AI计算的门槛。
与竞争对手的差距
相比于AMD以及英特尔所推出的产品而言, Vera Rubin于智能体工作负载方面展现出的性能优势显著突出, AMD推出的最新MI400系列产品在通用计算领域与英伟达对比虽说较为接近, 然而在专门针对AI进行优化设计的POD架构方面却落后了一代, 英特尔目前还在对其AI芯片战略作出调整, 在短时间之内难以与之相抗衡。

对于英伟达来讲, 其护城河并非仅仅局限于硬件性能这一方面, 更关键的乃是CUDA生态以及系统级优化这两点。Vera Rubin将从CPU一直到网络的一整套组件进行了整合, 而其竞争对手要去复制这种深度耦合的架构是极为困难的。很有可能在未来的两年时间之内, 英伟达在AI基础设施领域所占据的统治地位会得到进一步的巩固。
发货时间和市场影响
维 Vera Rubin 的产品预估会在今年秋天开始发货, 这表明从第三季度起始, 部分客户便能够拿到实际硬件去实施部署, 对于那些正在进行 AI 数据中心扩建的企业而言, 这个时间节点极为关键, 它们能够提前去规划 2027 年的算力扩容计划。
基于市场层面而言, Vera Rubin的推出会进一步拉大英伟达同竞争对手之间的差距, 投资者大多看好AI基础设施需求, 有英伟达股价在消息公布之后出现小幅上涨的情况, 然而供应紧张这一问题在短期内难以得到缓解, 预计Vera Rubin在上市最初阶段将会面临抢购态势。
请问, 你觉得Vera Rubin的推出, 究竟是会促使AI应用的普遍推广速度得以加快, 也或者仅是会使得大公司变得愈发强大? 欢迎于评论区之中分享你持有的观点之意向, 去点赞以及转发这篇文章, 进而让更多的人能够知晓AI算力的最新发展进程情况。