英伟达 GTC 2026 重磅发布:Vera Rubin 平台与万亿订单
发布时间:2026-03-17
一、Vera Rubin AI 计算平台:六芯合一的 “AI 超级计算机”
- 制程工艺:台积电 3nm(N3P) 先进工艺。
- 晶体管数量:3360 亿个,较 Blackwell(GB200)的 2080 亿增加 62%。
- 架构设计:采用 双芯粒(Die-to-Die) 设计,两颗光罩级(Reticle-sized)计算芯片 + 1 颗 I/O 芯片,通过 SoIC 3D 堆叠 封装集成。
- 显存系统:搭载 288GB HBM4 高带宽显存,总带宽高达 22TB/s,是 HBM3E 的约 2.8 倍。
- 算力性能:
- 推理算力(NVFP4 精度):50 PFLOPS(50000 万亿次 / 秒),是 Blackwell 的 5 倍NVIDIA。
- 训练算力(FP8 精度):35 PFLOPS,是 Blackwell 的 3.5 倍。
- 关键技术:第三代 Transformer 引擎,内置硬件级自适应压缩技术,在不损失精度的前提下大幅提升 Token 处理效率NVIDIA。
- 架构:基于 ARMv9.2-A 架构,深度定制 88 核 Olympus 核心。
- 多线程:支持 176 线程(88 核 ×2)。
- 互联:采用 NVLink-C2C 直连技术,与 GPU 芯片间带宽 1.8TB/s,是 PCIe 6.0 的 7 倍,实现 CPU-GPU 统一内存,消除数据拷贝延迟。
- 定位:专门负责 AI 任务调度、大规模数据搬运、控制流执行,最大化 GPU 利用率。
- 第六代超级互联交换机,单柜可连接 72 块 Rubin GPU + 36 块 Vera CPU(NVL72 机架)。
- 整机柜带宽:>260TB/s。
- (5) BlueField-4 DPU(数据处理器)
- (6) Spectrum-6 以太网交换机
- 以上三款芯片构成 高速、安全、软件定义的网络基础设施,负责数据中心内外的高速数据传输、安全隔离与存储卸载。
- 全液冷设计:采用 45°C 温水 散热,移除传统风冷线缆。
- 部署效率:数据中心部署时间从 48 小时缩短至 2 小时。
- 能效表现:处理 MoE 大模型 时,仅需 Blackwell 平台 1/4 的 GPU 数量;每瓦推理吞吐量提升 10 倍。
二、下一代芯片:Feynman(费曼)—— 迈入 1.6nm 埃米时代
- 制程工艺:全球首款采用台积电 A16(1.6nm) 工艺的芯片,标志半导体正式进入 “埃米(Å)时代”。
- 性能提升:相较 3nm 工艺,同性能下功耗降低 15%-20%,速度提升 8%-10%,晶体管密度提升 1.1 倍。
- 核心技术:集成 GAA(环绕栅极)晶体管、背面供电(SPR)、3D 堆叠、共封装光学(CPO)硅光技术。
- 时间规划:台积电 A16 工艺预计 2026 年下半年试产;Feynman 芯片计划 2028 年正式量产。
三、商业核弹:2027 年订单规模达 1 万亿美元
“去年此时,我们预计 Blackwell 与 Rubin 至 2026 年有 5000 亿美元需求。现在,我宣布:截至 2027 年,这两代平台的订单规模将达到 至少 1 万亿美元(At least $1 Trillion)。”
- 需求来源:全球云服务商、企业级 AI 应用、自动驾驶、生命科学、金融科技等领域对 AI 推理算力的爆发式需求。
- 市场解读:此预测较去年翻倍,直接反映 AI 基础设施建设进入井喷期,英伟达凭借技术壁垒锁定全球高端算力市场主导权。
四、核心意义总结
- 技术代际跨越:Rubin 平台将 AI 算力从 “训练为王” 推向 “推理优先”,是支撑未来万亿参数模型与智能体应用的物理基石。
- 成本结构重构:通过极致能效比,将 单 Token 成本降至 Blackwell 的 1/10,为 AI 应用商业化扫清最大障碍。
- 产业规模爆发:万亿美元订单预期不仅是英伟达的胜利,更是全球 AI 产业进入规模化落地阶段的最强信号。
相关新闻
曦望发布新一代推理GPU芯片,单位Token推理成本降低90%
国产GPU厂商曦望(Sunrise)重磅发布新一代推理GPU芯片——启望S3。这是曦望在近一年累计完成约30亿元战略融资后的首次集中公开亮相。2025年,曦望芯片交付量已突破万片。启望S3是专为大模型推理打造的定制化GPGPU芯片。在典型推理场景下,它的整体性价比较上一代提升超10倍。在算力与存储设计方面,该芯片支持FP16至FP4精度切换,采用LPDDR6显存方案,显存容量提升4倍,有效缓解了大
2026-01-29
英特尔 + 力积电 + 软银将展示 9 层 DRAM 堆叠,AI 内存功耗大降
集邦咨询 5 月 22 日发布博文,基于VLSI 2026(夏威夷)会议泄露的预发布摘要:力积电(PSMC)、英特尔、软银旗下 SAIMEMORY将联合展出新一代Via‑in‑One TSV架构,用于9 层 DRAM 堆叠,面向AI 训练 / 推理、高性能计算(HPC)场景,主打更高带宽、更低数据搬运功耗。一、合作背景:ZAM 项目扩军英特尔与 SAIMEMORY 此前已在推进Z‑Ang
2026-05-23
上海人工智能实验室(上海 AI 实验室) 官方宣布:联合厦门大学、苏州国家实验室等单位,依托2030 新一代人工智能国家科技重大专项,基于自主 **“书生” 科学大模型(Intern-S1)与“书生” 科学发现平台 **,成功构建 **“AI 决策 + 自动化合成” 全闭环研发体系 **,实现高纯度、高一致性、高效率的 KrF(氟化氪)光刻胶树脂完全自主创制,打破国外长期技术垄断。一、背景与意义<
2026-05-13
立即询价