首页

英伟达 GTC 2026 重磅发布：Vera Rubin 平台与万亿订单

发布时间：2026-03-17

英伟达（NVIDIA）在加州圣何塞举办年度 GTC 2026 开发者大会。创始人兼 CEO 黄仁勋（Jensen Huang）发表主题演讲，正式发布面向 “代理式 AI”（Agentic AI）时代的 Vera Rubin 新一代 AI 计算平台，并公布了震撼业界的商业预期。一、Vera Rubin AI 计算平台：六芯合一的 “AI 超级计算机”Vera Rubin 并非单一芯片，而

英伟达（NVIDIA）在加州圣何塞举办年度 GTC 2026 开发者大会。创始人兼 CEO 黄仁勋（Jensen Huang）发表主题演讲，正式发布面向 “代理式 AI”（Agentic AI）时代的 Vera Rubin 新一代 AI 计算平台，并公布了震撼业界的商业预期。

一、Vera Rubin AI 计算平台：六芯合一的 “AI 超级计算机”

Vera Rubin 并非单一芯片，而是由 6 款全新芯片深度协同、面向下一代数据中心的全栈式 AI 超算平台，全面接替上一代 Blackwell 架构。

1. 核心定位

专为自主智能体、大规模长上下文推理、混合专家模型（MoE）设计，核心目标是将 AI 推理成本降低 90%，同时能效提升 10 倍，解决当前大模型运行的 “算力贵、耗电高” 难题。

2. 六大核心芯片详解

(1) Rubin GPU（计算核心，代号 R100）

制程工艺：台积电 3nm（N3P）先进工艺。
晶体管数量：3360 亿个，较 Blackwell（GB200）的 2080 亿增加 62%。
架构设计：采用双芯粒（Die-to-Die）设计，两颗光罩级（Reticle-sized）计算芯片 + 1 颗 I/O 芯片，通过 SoIC 3D 堆叠封装集成。
显存系统：搭载 288GB HBM4 高带宽显存，总带宽高达 22TB/s，是 HBM3E 的约 2.8 倍。
算力性能：
- 推理算力（NVFP4 精度）：50 PFLOPS（50000 万亿次 / 秒），是 Blackwell 的 5 倍NVIDIA。
- 训练算力（FP8 精度）：35 PFLOPS，是 Blackwell 的 3.5 倍。
关键技术：第三代 Transformer 引擎，内置硬件级自适应压缩技术，在不损失精度的前提下大幅提升 Token 处理效率NVIDIA。

(2) Vera CPU（协同控制核心）

架构：基于 ARMv9.2-A 架构，深度定制 88 核 Olympus 核心。
多线程：支持 176 线程（88 核 ×2）。
互联：采用 NVLink-C2C 直连技术，与 GPU 芯片间带宽 1.8TB/s，是 PCIe 6.0 的 7 倍，实现 CPU-GPU 统一内存，消除数据拷贝延迟。
定位：专门负责 AI 任务调度、大规模数据搬运、控制流执行，最大化 GPU 利用率。

(3) NVLink 6 交换机

第六代超级互联交换机，单柜可连接 72 块 Rubin GPU + 36 块 Vera CPU（NVL72 机架）。
整机柜带宽：>260TB/s。

(4) ConnectX-9 超级网卡

(5) BlueField-4 DPU（数据处理器）
(6) Spectrum-6 以太网交换机
以上三款芯片构成高速、安全、软件定义的网络基础设施，负责数据中心内外的高速数据传输、安全隔离与存储卸载。

3. 平台整机与能效革命

全液冷设计：采用 45°C 温水散热，移除传统风冷线缆。
部署效率：数据中心部署时间从 48 小时缩短至 2 小时。
能效表现：处理 MoE 大模型时，仅需 Blackwell 平台 1/4 的 GPU 数量；每瓦推理吞吐量提升 10 倍。

4. 量产与交付

黄仁勋宣布，Vera Rubin 平台已全面量产，合作伙伴的服务器产品将于 2026 年下半年开始大规模交付。

二、下一代芯片：Feynman（费曼）—— 迈入 1.6nm 埃米时代

作为 Vera Rubin 的继任者，英伟达同步公布了代号 Feynman（费曼）的芯片规划。

制程工艺：全球首款采用台积电 A16（1.6nm）工艺的芯片，标志半导体正式进入 “埃米（Å）时代”。
性能提升：相较 3nm 工艺，同性能下功耗降低 15%-20%，速度提升 8%-10%，晶体管密度提升 1.1 倍。
核心技术：集成 GAA（环绕栅极）晶体管、背面供电（SPR）、3D 堆叠、共封装光学（CPO）硅光技术。
时间规划：台积电 A16 工艺预计 2026 年下半年试产；Feynman 芯片计划 2028 年正式量产。

三、商业核弹：2027 年订单规模达 1 万亿美元

演讲最震撼环节，黄仁勋公布了远超市场预期的商业前景：

“去年此时，我们预计 Blackwell 与 Rubin 至 2026 年有 5000 亿美元需求。现在，我宣布：截至 2027 年，这两代平台的订单规模将达到至少 1 万亿美元（At least $1 Trillion）。”

需求来源：全球云服务商、企业级 AI 应用、自动驾驶、生命科学、金融科技等领域对 AI 推理算力的爆发式需求。
市场解读：此预测较去年翻倍，直接反映 AI 基础设施建设进入井喷期，英伟达凭借技术壁垒锁定全球高端算力市场主导权。

四、核心意义总结

技术代际跨越：Rubin 平台将 AI 算力从 “训练为王” 推向 “推理优先”，是支撑未来万亿参数模型与智能体应用的物理基石。
成本结构重构：通过极致能效比，将单 Token 成本降至 Blackwell 的 1/10，为 AI 应用商业化扫清最大障碍。
产业规模爆发：万亿美元订单预期不仅是英伟达的胜利，更是全球 AI 产业进入规模化落地阶段的最强信号。

上一个

马斯克官宣特斯拉 Terafab 超级芯片厂 7 天后动工，标志车企正式切入芯片制造；同时美国撤回 AI 芯片出口规则、存储 / 成熟制程全线涨价、北大发布 6G + 光芯片 “万能心脏”。

英伟达 GTC 2026 大会（北京时间 3 月 17 日凌晨）核心发布：Vera Rubin 全平台与 1.6nm Feynman 芯片

下一个

上一个

无

下一个

三年蝉联全球TOP50｜AMPLE SOLUTIONS如何持续领跑电子分销赛道

相关新闻

曦望发布新一代推理GPU芯片，单位Token推理成本降低90%

国产GPU厂商曦望（Sunrise）重磅发布新一代推理GPU芯片——启望S3。这是曦望在近一年累计完成约30亿元战略融资后的首次集中公开亮相。2025年，曦望芯片交付量已突破万片。启望S3是专为大模型推理打造的定制化GPGPU芯片。在典型推理场景下，它的整体性价比较上一代提升超10倍。在算力与存储设计方面，该芯片支持FP16至FP4精度切换，采用LPDDR6显存方案，显存容量提升4倍，有效缓解了大

2026-01-29

英特尔 + 力积电 + 软银将展示 9 层 DRAM 堆叠，AI 内存功耗大降

集邦咨询 5 月 22 日发布博文，基于VLSI 2026（夏威夷）会议泄露的预发布摘要：力积电（PSMC）、英特尔、软银旗下 SAIMEMORY将联合展出新一代Via‑in‑One TSV架构，用于9 层 DRAM 堆叠，面向AI 训练 / 推理、高性能计算（HPC）场景，主打更高带宽、更低数据搬运功耗。一、合作背景：ZAM 项目扩军英特尔与 SAIMEMORY 此前已在推进Z‑Ang

2026-05-23

上海 AI 实验室攻克 KrF 光刻胶树脂

上海人工智能实验室（上海 AI 实验室）官方宣布：联合厦门大学、苏州国家实验室等单位，依托2030 新一代人工智能国家科技重大专项，基于自主 **“书生” 科学大模型（Intern-S1）与“书生” 科学发现平台 **，成功构建 **“AI 决策 + 自动化合成” 全闭环研发体系 **，实现高纯度、高一致性、高效率的 KrF（氟化氪）光刻胶树脂完全自主创制，打破国外长期技术垄断。一、背景与意义<

2026-05-13

虹亚半导体（深圳）有限公司

深圳市龙岗区钧濠MIX park营销中心11层

15361522645

lizhihua@hybdtjt.com

362023919

关于虹亚

产品分类

品质保证

市场洞察

新闻中心

联系我们

网站建设：

营业执照