首页

英伟达 GTC 2026 大会（北京时间 3 月 17 日凌晨）核心发布：Vera Rubin 全平台与 1.6nm Feynman 芯片

发布时间：2026-03-18

一、Vera Rubin AI 计算平台：七芯协同，定义 AI 超算新标准发布背景：英伟达创始人兼 CEO 黄仁勋在 GTC 2026 主题演讲中正式发布Vera Rubin平台。这并非单一 GPU，而是英伟达从 “芯片公司” 转向 “AI 基础设施公司” 的战略级产品，是一套专为智能体（Agentic AI）与超大规模 AI 集群设计的完整系统。平台以已故天文学家薇拉・鲁宾（Vera

一、Vera Rubin AI 计算平台：七芯协同，定义 AI 超算新标准

发布背景：

英伟达创始人兼 CEO 黄仁勋在 GTC 2026 主题演讲中正式发布Vera Rubin平台。这并非单一 GPU，而是英伟达从 “芯片公司” 转向 “AI 基础设施公司” 的战略级产品，是一套专为智能体（Agentic AI）与超大规模 AI 集群设计的完整系统。平台以已故天文学家薇拉・鲁宾（Vera Rubin）命名，寓意探索 AI 宇宙的 “暗物质”—— 极致算力。

核心构成：7 款全新芯片全解析

该平台由 7 款深度协同的芯片组成，覆盖计算、互联、网络、存储全链路：

Rubin GPU（算力核心）
- 工艺：台积电3nm（N3P）先进工艺，采用SoIC 3D 堆叠封装，集成3360 亿晶体管。
- 架构：搭载第三代 Transformer 引擎，专为大模型推理与训练优化。
- 算力：NVFP4精度下推理算力50 PFLOPS（是上一代 Blackwell 的 5 倍）；训练算力35 PFLOPS（3.5 倍）。
- 内存：288GB HBM4高带宽内存，单片带宽高达22TB/s（2.8 倍）。
- 互联：单 GPUNVLink 6带宽3.6TB/s。
- 成本：单 Token 生成成本降至 Blackwell 的 1/10。
Vera CPU（英伟达首款服务器 CPU）
- 架构：自研 **ARMv9.2（Olympus）** 架构，88 核心 176 线程。
- 内存：全球首款数据中心级LPDDR5X CPU，支持最高1.5TB内存容量。
- 定位：专门负责 AI 任务调度、资源管理与智能体推理，性能较传统 x86 CPU 提升50%。
- 协同：通过NVLink-C2C与 Rubin GPU 实现 CPU-GPU 统一内存，数据移动效率翻倍。
Groq 3 LPU（新增推理加速器）
- 来源：基于英伟达200 亿美元收购的 Groq 技术，本次 GTC 首次产品化落地。
- 定位：专用语言推理单元，作为 Rubin GPU 的 “推理协处理器”，专攻极低延迟、高并发的 Token 生成。
- 参数：内置4GB SRAM，SRAM 带宽1200TB/s（是 Rubin GPU 的 55 倍），单芯片算力9.6 PFLOPS。
- 组合：8 颗 LPU 可组成阵列，与 Vera Rubin 平台结合后，每兆瓦推理吞吐量最高提升 35 倍。
NVLink 6 交换机芯片
- 功能：负责机架内 GPU 间的超高密度、低延迟互联。
- 性能：在标准NVL72机架中，提供260TB/s的内部总带宽。
BlueField-4 DPU（数据处理单元）
- 功能：卸载并加速 AI 数据中心的网络、存储与安全任务，专门管理KV 缓存（键值缓存）。
- 内存：配备128GB独立内存。
- 效能：将 AI 推理吞吐量提升最高5 倍。
ConnectX-9 SuperNIC（超级网卡）
- 速率：支持800Gb/s超高速网络。
- 协议：兼容InfiniBand & Ethernet双协议，为 AI 集群提供高速数据桥梁。
Spectrum-6 交换机芯片
- 带宽：102.4Tb/s端口带宽。
- 技术：支持CPO（共封装光学），功耗较传统方案降低70%。
- 定位：用于超大规模 AI 集群的骨干组网，实现横向扩展。

旗舰系统：Vera Rubin NVL72 机架

配置：72 颗 Rubin GPU + 36 颗 Vera CPUNVIDIA。
总算力：NVFP4 推理 3.6 EFLOPS（3600 PFLOPS）NVIDIA。
部署：全温水液冷，数据中心部署时间从48 小时缩短至 2 小时。
量产：2026 年下半年开始大规模交付。

二、下一代架构：1.6nm Feynman（费曼）芯片提前亮相

核心定位：

原定 2028 年发布的Feynman架构，本次提前两年曝光技术原型。这是全球首款1.6nm工艺、专为世界模型（World Model）与具身智能设计的芯片，旨在突破当前 AI 的物理极限。

革命性技术突破：

制程工艺：迈入 1nm 时代
- 工艺：采用台积电A16（1.6nm）“埃米级” 制程。
- 晶体管：**GAA（全环绕栅极）** 纳米片结构，替代传统 FinFET。
- 供电：超级电轨背面供电技术，将供电线路移至晶圆背面。
- 效能：同性能下功耗降低15%；同电压下速度提升8%-10%。
互连革命：硅光子光互连
- 技术：大规模商用硅光子（Silicon Photonics），用光信号替代铜缆电信号。
- 提升：带宽密度提升 10 倍，传输能耗降低 90%。
- 意义：彻底打破 “互连墙”，支撑百万 GPU 级超大规模集群协同。
架构创新：3D 堆叠异构集成
- 设计：将LPU 直接 3D 堆叠在 GPU 核心之上，数据传输距离极致缩短。
- 散热：采用培育钻石 + 液冷组合散热（钻石导热率是铜的 5 倍），应对 **2000W+** 的超高功耗。

战略意义：

Feynman 不仅是芯片迭代，更是英伟达对 ** 通用人工智能（AGI）** 基础设施的提前布局。黄仁勋表示，该架构将支撑 AI 从 “理解语言” 走向 “理解、预测并交互物理世界”。

三、黄仁勋核心论断：万亿美元市场与 Token 经济学

万亿美金预测
- 规模：2025-2027 年期间，基于Blackwell 与 Rubin平台的相关收入将至少达到 1 万亿美元。
- 依据：“计算需求增长了100 万倍，我们正面临全球性的算力短缺。”
Token 工厂经济学
- 核心观点：Token 就是新的货币，未来数据中心是生产 Token 的 “工厂”。
- 竞争关键：每瓦电力能产生多少 Token（即能效比），决定企业生死。
- Vera Rubin 价值：将 AI 的单位算力成本降至历史最低，让 Token “像空气一样便宜”。

上一个

英伟达 GTC 2026 重磅发布：Vera Rubin 平台与万亿订单

三星电子史上最大规模罢工投票通过

下一个

上一个

无

下一个

三年蝉联全球TOP50｜AMPLE SOLUTIONS如何持续领跑电子分销赛道

相关新闻

国产光芯片大突破，算力超百倍，绕开EUV

据新华社报道，上海交通大学集成电路学院陈一彤课题组在新一代光计算芯片领域取得重大突破，首次实现支持大规模语义媒体生成模型的全光计算芯片LightGen，相关成果已经发表于国际顶级学术期刊《科学》（Science），并被选为高光论文重点报道。这是国际上首次实现大规模全光生成式AI芯片，标志着光计算在生成式AI领域的应用从理论可行性迈入实际效能领先阶段。全光计算芯片LightGen，突破三项世界级技术

2026-01-04

西电杭州研究院：硅锗 SPAD 芯片突破

：3 月 25 日，西安电子科技大学杭州研究院集成电路研究所胡辉勇团队宣布，成功研制出基于硅锗（SiGe）工艺的单光子雪崩二极管（SPAD）芯片。该技术将短波红外（SWIR）探测的制造成本从 “航天级” 大幅降至民用级，标志着该项高端传感技术有望大规模走进消费与工业市场。🧬 核心背景：为何此前难以民用？短波红外探测被誉为 “感知之眼”，具备穿透雾霾、夜间成像、物质识别等独特能力，但长期面

2026-03-26

WTK6900FC鼾声识别芯片在四种助眠场景中的应用

WTK6900FC鼾声识别芯片在四种助眠场景中的应用“跟你说个搞笑的事情，我刚才午睡的时候被我自己的呼噜声吵醒了...”这是真实发生在身边的事情。过去对于打呼噜这件事情，大家的态度就是“累了、上年纪了”等说辞，既有着理解也伴随着无奈，但是随着科技的快速发展，当下的科技产品当中，助眠止鼾类的产品正在逐渐成为一种潮流。鼾声的识别检测可以过麦克风阵列录音以后交给软件来分析，但是很难做到即时联动，这类型的

2025-12-03

虹亚半导体（深圳）有限公司

深圳市龙岗区钧濠MIX park营销中心11层

15361522645

lizhihua@hybdtjt.com

362023919

关于虹亚

产品分类

品质保证

市场洞察

新闻中心

联系我们

网站建设：

营业执照