华为中国合作伙伴大会 2026(举办地:深圳)现场,华为正式发布搭载昇腾 950PR(Ascend 950PR) 处理器的Atlas 350 AI 训练推理加速卡,标志着国产高端 AI 算力芯片正式进入规模商用阶段。
发布时间:2026-03-23
一、核心发布信息
- 发布主体:华为
- 发布时间:2026 年 3 月 22 日
- 核心产品:Atlas 350 AI 训练推理加速卡(核心芯片为昇腾 950PR)
- 上市状态:已正式上市销售
- 生态配套:昆仑、华鲲振宇、神州鲲泰、长江计算、宝德、软通华方、百信 7 家核心伙伴同步推出基于该卡的服务器整机产品
二、昇腾 950PR 核心技术升级
1. 算力性能:代际级跃升,对标国际竞品
- 核心算力:FP8 精度算力达1 PFLOPS,FP4 精度算力达1.56 PFLOPS,综合推理性能达到英伟达H20 的 2.87 倍。
- 精度支持:国内唯一支持原生 FP4 低精度推理的商用产品,同时兼容 FP16、FP8、MXFP8、HIF8 等多种格式,可显著降低大模型推理显存占用。
- 以70B 参数大模型为例,FP4 精度下仅需35GB 显存即可流畅运行,较 FP16(需 140GB)大幅节省资源,推理延迟降低40%。
- 架构设计:采用创新SIMD/SIMT 新同构设计,强化离散、碎片化数据处理能力,适配推荐算法、多模态推理等场景。
2. 存储与访存:突破显存瓶颈
- 自研 HBM 内存:搭载华为HiBL 1.0 高带宽内存,容量达112GB,是英伟达 H20 的1.16 倍,显存带宽达1.4TB/s。
- 访存效率优化:内存访问颗粒度从512 字节细化至128 字节,小算子访存效率提升4 倍,多模态内容生成速度提升60%。
3. 互联与扩展:支撑大规模集群
- 互联带宽跃升:片间互联带宽达2TB/s,较前代提升2.5 倍,支持灵衢 2.0 协议,可实现上千个计算节点协同工作,解决大规模集群通信时延问题。
- 集群能力:昇腾 950 超节点最大支持8192 张Atlas 950DT 加速卡,可支撑万亿级大模型训练与推理。
三、Atlas 350 加速卡核心参数
| 参数项 | 具体数值 | 对比优势 |
|---|---|---|
| FP4 精度算力 | 1.56 PFLOPS | 支撑超大模型高效推理 |
| 显存容量 | 112GB HBM | 较 H20 提升 16%,降低显存压力 |
| 显存带宽 | 1.4TB/s | 高速数据传输,减少时延 |
| 整卡功耗 | 600W | 约为 H20 的 1.5 倍,能效比优化 |
| 支持精度格式 | FP32/FP16/BF16/FP8/MXFP8/HiF8/MXFP4/HiF4 / 原生 FP4 | 全精度覆盖,适配多场景 |
四、核心应用场景
- 大模型推理:支撑 70B-100B 参数模型高效推理,降低部署成本,适配企业级大模型应用。
- 多模态生成:文生图、文生视频等场景生成速度提升 60%,满足内容创作高效需求。
- 高并发推荐:短视频推荐、电商广告、金融 AI 等场景,实现更低时延、更快响应。
- 智慧城市:支撑大规模城市数据计算、智能分析,助力政务与城市治理智能化。
五、产业意义与生态布局
- 国产算力突破:打破海外高端 AI 算力芯片垄断,实现从技术突破到规模商用的关键跨越,推动国产 AI 算力自主可控。
- 生态协同:华为昇腾已联合伙伴打造400 多款硬件产品、560 多个高性能算子、50 多个大模型及 1100 多个场景化应用,服务 2700 + 行业客户。
- 软件开放:CANN 等软件已开源拆分为 29 个安装包,编译效率提升 58%,累计支持 50 + 三方开源社区,降低开发者门槛。
- 场景落地:过去一个多月已有 10 + 伙伴推出基于昇腾的 OpenClaw 一体机,占据国内一体机市场80% 以上份额,快速赋能行业智能化。
六、后续规划
相关新闻
商务部正式回应美方加码芯片出口管制、封堵监管漏洞举措今日头条
商务部于 6 月 4 日召开月度例行新闻发布会,新闻发言人何咏前针对美国近期密集落地、以国家安全为名收紧芯片管制、修补对华芯片出口监管漏洞系列新规作出官方表态,为当日全球半导体产业链最核心政策消息,位列 6 月 5 日芯片行业头条。1、针对美方封堵芯片监管漏洞、加码芯片管制问题发言人明确:中方密切跟踪美方新一轮芯片管制新规落地进展。近年来美国反复滥用国家安全借口,持续迭代对华芯片、半导体设备、先进
2026-06-05
三星电子 2026 年 Q1 业绩:AI 存储驱动,单季利润创历史新高(
当地时间4 月 7 日,三星电子发布 2026 年第一季度未经审计业绩指引,核心财务数据全面炸裂,AI 服务器对 HBM、DRAM 的旺盛需求成为最核心驱动,标志着公司正式进入存储超级周期。1️⃣ 核心业绩:创季度与韩企历史双纪录整体规模:合并销售额133 万亿韩元(约6065 亿元人民币),同比 **+68.1%,环比+41.73%**。利润爆发:营业利润57.2 万亿韩元(约2608
2026-04-08
在AI发展浪潮下,算力体系的软硬件协同适配能力持续跃升,从芯片架构优化、大模型逐渐收敛到算力调度机制,全链路的技术迭代已大幅消解算力供给与应用需求间的适配性矛盾。当算力不再是制约AI应用的核心瓶颈时,存力的战略重要性随之凸显,成为决定算力价值能否高效释放的关键支撑。存力的核心效能直接关乎数据的存储密度、读写效率与安全性,无论是大模型训练还是实时业务场景下的低延迟数据调取,都对存力的性能指标、底层架
2026-01-04
立即询价