英伟达 GTC 2026 大会(北京时间 3 月 17 日凌晨)核心发布:Vera Rubin 全平台与 1.6nm Feynman 芯片
发布时间:2026-03-18
一、Vera Rubin AI 计算平台:七芯协同,定义 AI 超算新标准
- Rubin GPU(算力核心)
- 工艺:台积电3nm(N3P)先进工艺,采用SoIC 3D 堆叠封装,集成3360 亿晶体管。
- 架构:搭载第三代 Transformer 引擎,专为大模型推理与训练优化。
- 算力:NVFP4精度下推理算力50 PFLOPS(是上一代 Blackwell 的 5 倍);训练算力35 PFLOPS(3.5 倍)。
- 内存:288GB HBM4高带宽内存,单片带宽高达22TB/s(2.8 倍)。
- 互联:单 GPUNVLink 6带宽3.6TB/s。
- 成本:单 Token 生成成本降至 Blackwell 的 1/10。
- Vera CPU(英伟达首款服务器 CPU)
- 架构:自研 **ARMv9.2(Olympus)** 架构,88 核心 176 线程。
- 内存:全球首款数据中心级LPDDR5X CPU,支持最高1.5TB内存容量。
- 定位:专门负责 AI 任务调度、资源管理与智能体推理,性能较传统 x86 CPU 提升50%。
- 协同:通过NVLink-C2C与 Rubin GPU 实现 CPU-GPU 统一内存,数据移动效率翻倍。
- Groq 3 LPU(新增推理加速器)
- 来源:基于英伟达200 亿美元收购的 Groq 技术,本次 GTC 首次产品化落地。
- 定位:专用语言推理单元,作为 Rubin GPU 的 “推理协处理器”,专攻极低延迟、高并发的 Token 生成。
- 参数:内置4GB SRAM,SRAM 带宽1200TB/s(是 Rubin GPU 的 55 倍),单芯片算力9.6 PFLOPS。
- 组合:8 颗 LPU 可组成阵列,与 Vera Rubin 平台结合后,每兆瓦推理吞吐量最高提升 35 倍。
- NVLink 6 交换机芯片
- 功能:负责机架内 GPU 间的超高密度、低延迟互联。
- 性能:在标准NVL72机架中,提供260TB/s的内部总带宽。
- BlueField-4 DPU(数据处理单元)
- 功能:卸载并加速 AI 数据中心的网络、存储与安全任务,专门管理KV 缓存(键值缓存)。
- 内存:配备128GB独立内存。
- 效能:将 AI 推理吞吐量提升最高5 倍。
- ConnectX-9 SuperNIC(超级网卡)
- 速率:支持800Gb/s超高速网络。
- 协议:兼容InfiniBand & Ethernet双协议,为 AI 集群提供高速数据桥梁。
- Spectrum-6 交换机芯片
- 带宽:102.4Tb/s端口带宽。
- 技术:支持CPO(共封装光学),功耗较传统方案降低70%。
- 定位:用于超大规模 AI 集群的骨干组网,实现横向扩展。
- 配置:72 颗 Rubin GPU + 36 颗 Vera CPUNVIDIA。
- 总算力:NVFP4 推理 3.6 EFLOPS(3600 PFLOPS)NVIDIA。
- 部署:全温水液冷,数据中心部署时间从48 小时缩短至 2 小时。
- 量产:2026 年下半年开始大规模交付。
二、下一代架构:1.6nm Feynman(费曼)芯片提前亮相
- 制程工艺:迈入 1nm 时代
- 工艺:采用台积电A16(1.6nm)“埃米级” 制程。
- 晶体管:**GAA(全环绕栅极)** 纳米片结构,替代传统 FinFET。
- 供电:超级电轨背面供电技术,将供电线路移至晶圆背面。
- 效能:同性能下功耗降低15%;同电压下速度提升8%-10%。
- 互连革命:硅光子光互连
- 技术:大规模商用硅光子(Silicon Photonics),用光信号替代铜缆电信号。
- 提升:带宽密度提升 10 倍,传输能耗降低 90%。
- 意义:彻底打破 “互连墙”,支撑百万 GPU 级超大规模集群协同。
- 架构创新:3D 堆叠异构集成
- 设计:将LPU 直接 3D 堆叠在 GPU 核心之上,数据传输距离极致缩短。
- 散热:采用培育钻石 + 液冷组合散热(钻石导热率是铜的 5 倍),应对 **2000W+** 的超高功耗。
三、黄仁勋核心论断:万亿美元市场与 Token 经济学
- 万亿美金预测
- 规模:2025-2027 年期间,基于Blackwell 与 Rubin平台的相关收入将至少达到 1 万亿美元。
- 依据:“计算需求增长了100 万倍,我们正面临全球性的算力短缺。”
- Token 工厂经济学
- 核心观点:Token 就是新的货币,未来数据中心是生产 Token 的 “工厂”。
- 竞争关键:每瓦电力能产生多少 Token(即能效比),决定企业生死。
- Vera Rubin 价值:将 AI 的单位算力成本降至历史最低,让 Token “像空气一样便宜”。
相关新闻
享誉全球的半导体产业盛会ICCAD-Expo(第31届)将于11月20日-21日在成都·中国西部国际博览城盛大召开,来自全球领先的Foundry、EDA、IP、设计服务、封测、设计企业及合作伙伴将欢聚成都,分享集成电路前沿技术与创新成果。 届时大会主席、中国半导体行业协会集成电路设计分会魏少军教授将分享《技术创新驱动设计产业升级》主旨报告,台积电、UMC和舰科技、中芯国际、华力、西门子EDA、三
2025-11-12
国内模拟与混合信号芯片龙头上海晶丰明源半导体股份有限公司发布公告,宣布拟通过发行股份及支付现金的方式,以32.83亿元收购四川易冲科技有限公司(以下简称“易冲科技”)100%股权,并同步募集配套资金18亿元。此次收购采用“股份+现金”组合支付方式,总对价32.83亿元中,现金支付12.49亿元(占比38.05%),股份支付20.33亿元(占比61.95%),发行价格定为50.39元/股,预计发行股
2026-01-15
1600TOPS!美国新势力车企自研5nm芯片,转用激光雷达硬刚特斯拉
新势力车企自研芯片似乎已经成为一个共识,近年来,蔚来、小鹏陆续实现了自研自动驾驶芯片的上车,理想也预计2026年量产自研芯片。在近日美国新势力车企Rivian举办的2025 AI Day上,也首次公布了自研自动驾驶大模型,以及自研的5nm定制芯片,同时还明确了激光雷达是其下一代自动驾驶系统的核心传感器之一。5nm芯片、高速互连、全新神经网络引擎作为一家美国新势力车企,Rivian多年前就被视为特斯
2026-01-04
立即询价