英伟达 GTC 2026 大会(北京时间 3 月 17 日凌晨)核心发布:Vera Rubin 全平台与 1.6nm Feynman 芯片
发布时间:2026-03-18
一、Vera Rubin AI 计算平台:七芯协同,定义 AI 超算新标准
- Rubin GPU(算力核心)
- 工艺:台积电3nm(N3P)先进工艺,采用SoIC 3D 堆叠封装,集成3360 亿晶体管。
- 架构:搭载第三代 Transformer 引擎,专为大模型推理与训练优化。
- 算力:NVFP4精度下推理算力50 PFLOPS(是上一代 Blackwell 的 5 倍);训练算力35 PFLOPS(3.5 倍)。
- 内存:288GB HBM4高带宽内存,单片带宽高达22TB/s(2.8 倍)。
- 互联:单 GPUNVLink 6带宽3.6TB/s。
- 成本:单 Token 生成成本降至 Blackwell 的 1/10。
- Vera CPU(英伟达首款服务器 CPU)
- 架构:自研 **ARMv9.2(Olympus)** 架构,88 核心 176 线程。
- 内存:全球首款数据中心级LPDDR5X CPU,支持最高1.5TB内存容量。
- 定位:专门负责 AI 任务调度、资源管理与智能体推理,性能较传统 x86 CPU 提升50%。
- 协同:通过NVLink-C2C与 Rubin GPU 实现 CPU-GPU 统一内存,数据移动效率翻倍。
- Groq 3 LPU(新增推理加速器)
- 来源:基于英伟达200 亿美元收购的 Groq 技术,本次 GTC 首次产品化落地。
- 定位:专用语言推理单元,作为 Rubin GPU 的 “推理协处理器”,专攻极低延迟、高并发的 Token 生成。
- 参数:内置4GB SRAM,SRAM 带宽1200TB/s(是 Rubin GPU 的 55 倍),单芯片算力9.6 PFLOPS。
- 组合:8 颗 LPU 可组成阵列,与 Vera Rubin 平台结合后,每兆瓦推理吞吐量最高提升 35 倍。
- NVLink 6 交换机芯片
- 功能:负责机架内 GPU 间的超高密度、低延迟互联。
- 性能:在标准NVL72机架中,提供260TB/s的内部总带宽。
- BlueField-4 DPU(数据处理单元)
- 功能:卸载并加速 AI 数据中心的网络、存储与安全任务,专门管理KV 缓存(键值缓存)。
- 内存:配备128GB独立内存。
- 效能:将 AI 推理吞吐量提升最高5 倍。
- ConnectX-9 SuperNIC(超级网卡)
- 速率:支持800Gb/s超高速网络。
- 协议:兼容InfiniBand & Ethernet双协议,为 AI 集群提供高速数据桥梁。
- Spectrum-6 交换机芯片
- 带宽:102.4Tb/s端口带宽。
- 技术:支持CPO(共封装光学),功耗较传统方案降低70%。
- 定位:用于超大规模 AI 集群的骨干组网,实现横向扩展。
- 配置:72 颗 Rubin GPU + 36 颗 Vera CPUNVIDIA。
- 总算力:NVFP4 推理 3.6 EFLOPS(3600 PFLOPS)NVIDIA。
- 部署:全温水液冷,数据中心部署时间从48 小时缩短至 2 小时。
- 量产:2026 年下半年开始大规模交付。
二、下一代架构:1.6nm Feynman(费曼)芯片提前亮相
- 制程工艺:迈入 1nm 时代
- 工艺:采用台积电A16(1.6nm)“埃米级” 制程。
- 晶体管:**GAA(全环绕栅极)** 纳米片结构,替代传统 FinFET。
- 供电:超级电轨背面供电技术,将供电线路移至晶圆背面。
- 效能:同性能下功耗降低15%;同电压下速度提升8%-10%。
- 互连革命:硅光子光互连
- 技术:大规模商用硅光子(Silicon Photonics),用光信号替代铜缆电信号。
- 提升:带宽密度提升 10 倍,传输能耗降低 90%。
- 意义:彻底打破 “互连墙”,支撑百万 GPU 级超大规模集群协同。
- 架构创新:3D 堆叠异构集成
- 设计:将LPU 直接 3D 堆叠在 GPU 核心之上,数据传输距离极致缩短。
- 散热:采用培育钻石 + 液冷组合散热(钻石导热率是铜的 5 倍),应对 **2000W+** 的超高功耗。
三、黄仁勋核心论断:万亿美元市场与 Token 经济学
- 万亿美金预测
- 规模:2025-2027 年期间,基于Blackwell 与 Rubin平台的相关收入将至少达到 1 万亿美元。
- 依据:“计算需求增长了100 万倍,我们正面临全球性的算力短缺。”
- Token 工厂经济学
- 核心观点:Token 就是新的货币,未来数据中心是生产 Token 的 “工厂”。
- 竞争关键:每瓦电力能产生多少 Token(即能效比),决定企业生死。
- Vera Rubin 价值:将 AI 的单位算力成本降至历史最低,让 Token “像空气一样便宜”。
相关新闻
比亚迪发布国产首款 4nm 智驾芯片「璇玑 A3」(已量产)
时间:2026 年 5 月 28 日晚(深圳总部发布会)发布方:比亚迪(BYD)产品名:璇玑 A3(国内首款 4nm 车规级智驾芯片,已规模化量产)一、核心定位与行业意义王传福开场定调:“电动化上半场看电池,智能化下半场看芯片”。璇玑 A3 为比亚迪第 567 款车规级芯片,填补国内4nm 车规级高算力智驾芯片量产空白,打破海外高端智驾芯片长期垄断。官方强调:4nm 车规级难度≈消费电子
2026-05-30
OpenAI 联合博通发布首款自研 AI 推理芯片 Jalapeño
一、事件核心概况当地时间 2026 年 6 月 24 日,OpenAI 正式对外公布首款自主定制 AI 专用推理芯片Jalapeño,该芯片由 OpenAI 负责架构设计、博通提供晶圆硬件落地、加拿大企业 Celestica 完成板卡与整机系统集成,全程仅耗时 9 个月就完成从设计到流片量产验证,研发阶段依托 OpenAI 自有大模型完成芯片设计加速,大幅压缩研发周期。二、芯片定位与实测
2026-06-25
一、市场行情(截至收盘)2026 年 5 月 13 日,A 股芯片 / 半导体板块全线爆发,上演深 V 反转强势行情:早盘:受美股半导体隔夜重挫影响,科创芯片指数一度跌超 3%。午后:资金大举回流,板块强势拉升,掀起涨停潮。收盘:20% 涨停(科创板):瑞华泰、时代电气、中船特气、天准科技(接近 20%)。10% 涨停(主板 / 创业板):众合科技、可川科技、大族激光、工业富联、雅克科技、德明利、
2026-05-14
立即询价