华为中国合作伙伴大会 2026(举办地:深圳)现场,华为正式发布搭载昇腾 950PR(Ascend 950PR) 处理器的Atlas 350 AI 训练推理加速卡,标志着国产高端 AI 算力芯片正式进入规模商用阶段。
发布时间:2026-03-23
一、核心发布信息发布主体:华为发布时间:2026 年 3 月 22 日核心产品:Atlas 350 AI 训练推理加速卡(核心芯片为昇腾 950PR)上市状态:已正式上市销售生态配套:昆仑、华鲲振宇、神州鲲泰、长江计算、宝德、软通华方、百信 7 家核心伙伴同步推出基于该卡的服务器整机产品二、昇腾 950PR 核心技术升级1. 算力性能:代际级跃升,对标国际竞品核心算力
一、核心发布信息
- 发布主体:华为
- 发布时间:2026 年 3 月 22 日
- 核心产品:Atlas 350 AI 训练推理加速卡(核心芯片为昇腾 950PR)
- 上市状态:已正式上市销售
- 生态配套:昆仑、华鲲振宇、神州鲲泰、长江计算、宝德、软通华方、百信 7 家核心伙伴同步推出基于该卡的服务器整机产品
二、昇腾 950PR 核心技术升级
1. 算力性能:代际级跃升,对标国际竞品
- 核心算力:FP8 精度算力达1 PFLOPS,FP4 精度算力达1.56 PFLOPS,综合推理性能达到英伟达H20 的 2.87 倍。
- 精度支持:国内唯一支持原生 FP4 低精度推理的商用产品,同时兼容 FP16、FP8、MXFP8、HIF8 等多种格式,可显著降低大模型推理显存占用。
- 以70B 参数大模型为例,FP4 精度下仅需35GB 显存即可流畅运行,较 FP16(需 140GB)大幅节省资源,推理延迟降低40%。
- 架构设计:采用创新SIMD/SIMT 新同构设计,强化离散、碎片化数据处理能力,适配推荐算法、多模态推理等场景。
2. 存储与访存:突破显存瓶颈
- 自研 HBM 内存:搭载华为HiBL 1.0 高带宽内存,容量达112GB,是英伟达 H20 的1.16 倍,显存带宽达1.4TB/s。
- 访存效率优化:内存访问颗粒度从512 字节细化至128 字节,小算子访存效率提升4 倍,多模态内容生成速度提升60%。
3. 互联与扩展:支撑大规模集群
- 互联带宽跃升:片间互联带宽达2TB/s,较前代提升2.5 倍,支持灵衢 2.0 协议,可实现上千个计算节点协同工作,解决大规模集群通信时延问题。
- 集群能力:昇腾 950 超节点最大支持8192 张Atlas 950DT 加速卡,可支撑万亿级大模型训练与推理。
三、Atlas 350 加速卡核心参数
表格
<svg width="24" height="24" viewBox="0 0 24 24" fill="currentColor" xmlns="http://www.w3.org/2000/svg" style="font-variant-numeric: normal; font-variant-east-asian: normal; font-variant-alternates: normal; font-size-adjust: none; font-kerning: auto; font-optical-sizing: auto; font-feature-settings: normal; font-variation-settings: normal; font-variant-position: normal; font-variant-emoji: normal; font-stretch: normal; line-height: 24px; display: block; flex: 0 1 auto; flex-direction: row; justify-content: normal; align-items: normal; padding: 0px; margin: 0px; background: none 0% 0% / auto repeat scroll padding-box border-box rgba(0, 0, 0, 0);"> </svg>
<svg width="24" height="24" viewBox="0 0 24 24" fill="currentColor" xmlns="http://www.w3.org/2000/svg" style="font-variant-numeric: normal; font-variant-east-asian: normal; font-variant-alternates: normal; font-size-adjust: none; font-kerning: auto; font-optical-sizing: auto; font-feature-settings: normal; font-variation-settings: normal; font-variant-position: normal; font-variant-emoji: normal; font-stretch: normal; line-height: 24px; display: block; flex: 0 1 auto; flex-direction: row; justify-content: normal; align-items: normal; padding: 0px; margin: 0px; background: none 0% 0% / auto repeat scroll padding-box border-box rgba(0, 0, 0, 0);"> </svg>
<svg width="24" height="24" viewBox="0 0 24 24" fill="currentColor" xmlns="http://www.w3.org/2000/svg" style="font-variant-numeric: normal; font-variant-east-asian: normal; font-variant-alternates: normal; font-size-adjust: none; font-kerning: auto; font-optical-sizing: auto; font-feature-settings: normal; font-variation-settings: normal; font-variant-position: normal; font-variant-emoji: normal; font-stretch: normal; line-height: 24px; display: block; flex: 0 1 auto; flex-direction: row; justify-content: normal; align-items: normal; padding: 0px; margin: 0px; background: none 0% 0% / auto repeat scroll padding-box border-box rgba(0, 0, 0, 0);"> </svg>
| 参数项 | 具体数值 | 对比优势 |
|---|---|---|
| FP4 精度算力 | 1.56 PFLOPS | 支撑超大模型高效推理 |
| 显存容量 | 112GB HBM | 较 H20 提升 16%,降低显存压力 |
| 显存带宽 | 1.4TB/s | 高速数据传输,减少时延 |
| 整卡功耗 | 600W | 约为 H20 的 1.5 倍,能效比优化 |
| 支持精度格式 | FP32/FP16/BF16/FP8/MXFP8/HiF8/MXFP4/HiF4 / 原生 FP4 | 全精度覆盖,适配多场景 |
四、核心应用场景
- 大模型推理:支撑 70B-100B 参数模型高效推理,降低部署成本,适配企业级大模型应用。
- 多模态生成:文生图、文生视频等场景生成速度提升 60%,满足内容创作高效需求。
- 高并发推荐:短视频推荐、电商广告、金融 AI 等场景,实现更低时延、更快响应。
- 智慧城市:支撑大规模城市数据计算、智能分析,助力政务与城市治理智能化。
五、产业意义与生态布局
- 国产算力突破:打破海外高端 AI 算力芯片垄断,实现从技术突破到规模商用的关键跨越,推动国产 AI 算力自主可控。
- 生态协同:华为昇腾已联合伙伴打造400 多款硬件产品、560 多个高性能算子、50 多个大模型及 1100 多个场景化应用,服务 2700 + 行业客户。
- 软件开放:CANN 等软件已开源拆分为 29 个安装包,编译效率提升 58%,累计支持 50 + 三方开源社区,降低开发者门槛。
- 场景落地:过去一个多月已有 10 + 伙伴推出基于昇腾的 OpenClaw 一体机,占据国内一体机市场80% 以上份额,快速赋能行业智能化。
六、后续规划
华为将围绕大、中、小三大核心算力场景布局,分别适配万亿级、千亿级、百亿级模型需求,联合伙伴推出更多适配场景的产品与解决方案,加速 AI 技术在各行业的落地应用。
相关新闻
:3 月 25 日,西安电子科技大学杭州研究院集成电路研究所胡辉勇团队宣布,成功研制出基于硅锗(SiGe)工艺的单光子雪崩二极管(SPAD)芯片。该技术将短波红外(SWIR)探测的制造成本从 “航天级” 大幅降至民用级,标志着该项高端传感技术有望大规模走进消费与工业市场。🧬 核心背景:为何此前难以民用?短波红外探测被誉为 “感知之眼”,具备穿透雾霾、夜间成像、物质识别等独特能力,但长期面
2026-03-26
在AI狂奔之际,也让市场中先进制程芯片身价倍增,国际巨头纷纷开始向12英寸以及AI外围芯片需求进行大力投入。而就在这时,芯片代工厂们宣布要开始涨价了,但这次涨价主角的并非大尺寸晶圆,而是以8英寸晶圆代工为主的成熟代工。成熟代工集体涨价据市场调研机构TrendForce发布的最新报告显示,全球的8英寸晶圆供需已经开始失衡。受到台积电、三星电子战略性的削减产能影响,将导致2026年全球的8英寸代工总产
2026-01-22
1. 亚太芯片股早盘全线大涨(北京时间 4 月 6 日 9:00-15:00)4 月 6 日亚太交易时段,存储与 AI 芯片板块领涨科技股,核心驱动来自HBM 高带宽内存持续供需失衡、价格持续上行、中东地缘风险阶段性缓和、全球资金回流科技成长赛道三大因素。韩国市场:KOSPI 指数全天上涨 2.02%,收于 2865.3 点;三星电子盘中最高涨 3.98%,收盘涨 3.72%,报 78,
2026-04-07
立即询价