华为中国合作伙伴大会 2026(举办地:深圳)现场,华为正式发布搭载昇腾 950PR(Ascend 950PR) 处理器的Atlas 350 AI 训练推理加速卡,标志着国产高端 AI 算力芯片正式进入规模商用阶段。
发布时间:2026-03-23
一、核心发布信息
- 发布主体:华为
- 发布时间:2026 年 3 月 22 日
- 核心产品:Atlas 350 AI 训练推理加速卡(核心芯片为昇腾 950PR)
- 上市状态:已正式上市销售
- 生态配套:昆仑、华鲲振宇、神州鲲泰、长江计算、宝德、软通华方、百信 7 家核心伙伴同步推出基于该卡的服务器整机产品
二、昇腾 950PR 核心技术升级
1. 算力性能:代际级跃升,对标国际竞品
- 核心算力:FP8 精度算力达1 PFLOPS,FP4 精度算力达1.56 PFLOPS,综合推理性能达到英伟达H20 的 2.87 倍。
- 精度支持:国内唯一支持原生 FP4 低精度推理的商用产品,同时兼容 FP16、FP8、MXFP8、HIF8 等多种格式,可显著降低大模型推理显存占用。
- 以70B 参数大模型为例,FP4 精度下仅需35GB 显存即可流畅运行,较 FP16(需 140GB)大幅节省资源,推理延迟降低40%。
- 架构设计:采用创新SIMD/SIMT 新同构设计,强化离散、碎片化数据处理能力,适配推荐算法、多模态推理等场景。
2. 存储与访存:突破显存瓶颈
- 自研 HBM 内存:搭载华为HiBL 1.0 高带宽内存,容量达112GB,是英伟达 H20 的1.16 倍,显存带宽达1.4TB/s。
- 访存效率优化:内存访问颗粒度从512 字节细化至128 字节,小算子访存效率提升4 倍,多模态内容生成速度提升60%。
3. 互联与扩展:支撑大规模集群
- 互联带宽跃升:片间互联带宽达2TB/s,较前代提升2.5 倍,支持灵衢 2.0 协议,可实现上千个计算节点协同工作,解决大规模集群通信时延问题。
- 集群能力:昇腾 950 超节点最大支持8192 张Atlas 950DT 加速卡,可支撑万亿级大模型训练与推理。
三、Atlas 350 加速卡核心参数
| 参数项 | 具体数值 | 对比优势 |
|---|---|---|
| FP4 精度算力 | 1.56 PFLOPS | 支撑超大模型高效推理 |
| 显存容量 | 112GB HBM | 较 H20 提升 16%,降低显存压力 |
| 显存带宽 | 1.4TB/s | 高速数据传输,减少时延 |
| 整卡功耗 | 600W | 约为 H20 的 1.5 倍,能效比优化 |
| 支持精度格式 | FP32/FP16/BF16/FP8/MXFP8/HiF8/MXFP4/HiF4 / 原生 FP4 | 全精度覆盖,适配多场景 |
四、核心应用场景
- 大模型推理:支撑 70B-100B 参数模型高效推理,降低部署成本,适配企业级大模型应用。
- 多模态生成:文生图、文生视频等场景生成速度提升 60%,满足内容创作高效需求。
- 高并发推荐:短视频推荐、电商广告、金融 AI 等场景,实现更低时延、更快响应。
- 智慧城市:支撑大规模城市数据计算、智能分析,助力政务与城市治理智能化。
五、产业意义与生态布局
- 国产算力突破:打破海外高端 AI 算力芯片垄断,实现从技术突破到规模商用的关键跨越,推动国产 AI 算力自主可控。
- 生态协同:华为昇腾已联合伙伴打造400 多款硬件产品、560 多个高性能算子、50 多个大模型及 1100 多个场景化应用,服务 2700 + 行业客户。
- 软件开放:CANN 等软件已开源拆分为 29 个安装包,编译效率提升 58%,累计支持 50 + 三方开源社区,降低开发者门槛。
- 场景落地:过去一个多月已有 10 + 伙伴推出基于昇腾的 OpenClaw 一体机,占据国内一体机市场80% 以上份额,快速赋能行业智能化。
六、后续规划
相关新闻
WTK6900FC鼾声识别芯片在四种助眠场景中的应用“跟你说个搞笑的事情,我刚才午睡的时候被我自己的呼噜声吵醒了...”这是真实发生在身边的事情。过去对于打呼噜这件事情,大家的态度就是“累了、上年纪了”等说辞,既有着理解也伴随着无奈,但是随着科技的快速发展,当下的科技产品当中,助眠止鼾类的产品正在逐渐成为一种潮流。鼾声的识别检测可以过麦克风阵列录音以后交给软件来分析,但是很难做到即时联动,这类型的
2025-12-03
台积电2nm芯片成本暴涨80%!苹果A20、高通骁龙旗舰芯片集体涨价
2026年,年度旗舰手机单芯片进入2nm制程节点的竞速赛道,在手机市场整体大势不温不火的时候,来自手机SoC芯片和存储芯片的涨价不绝于耳。据外媒报道,行业分析师 Jeff Pu 称,苹果的可折叠 iPhone 将于今年 9 月发布,届时将与 iPhone 18 Pro 和 iPhone 18 Pro Max 机型共享相同的下一代 A20 Pro 芯片。iPhone折叠屏手机 和 iPhone 18
2026-01-21
据新华社报道,上海交通大学集成电路学院陈一彤课题组在新一代光计算芯片领域取得重大突破,首次实现支持大规模语义媒体生成模型的全光计算芯片LightGen,相关成果已经发表于国际顶级学术期刊《科学》(Science),并被选为高光论文重点报道。这是国际上首次实现大规模全光生成式AI芯片,标志着光计算在生成式AI领域的应用从理论可行性迈入实际效能领先阶段。全光计算芯片LightGen,突破三项世界级技术
2026-01-04
立即询价