英伟达 GTC 2026 大会(北京时间 3 月 17 日凌晨)核心发布:Vera Rubin 全平台与 1.6nm Feynman 芯片
发布时间:2026-03-18
一、Vera Rubin AI 计算平台:七芯协同,定义 AI 超算新标准发布背景:英伟达创始人兼 CEO 黄仁勋在 GTC 2026 主题演讲中正式发布Vera Rubin平台。这并非单一 GPU,而是英伟达从 “芯片公司” 转向 “AI 基础设施公司” 的战略级产品,是一套专为智能体(Agentic AI)与超大规模 AI 集群设计的完整系统。平台以已故天文学家薇拉・鲁宾(Vera
一、Vera Rubin AI 计算平台:七芯协同,定义 AI 超算新标准
发布背景:英伟达创始人兼 CEO 黄仁勋在 GTC 2026 主题演讲中正式发布Vera Rubin平台。这并非单一 GPU,而是英伟达从 “芯片公司” 转向 “AI 基础设施公司” 的战略级产品,是一套专为智能体(Agentic AI)与超大规模 AI 集群设计的完整系统。平台以已故天文学家薇拉・鲁宾(Vera Rubin)命名,寓意探索 AI 宇宙的 “暗物质”—— 极致算力。
核心构成:7 款全新芯片全解析该平台由 7 款深度协同的芯片组成,覆盖计算、互联、网络、存储全链路:
- Rubin GPU(算力核心)
- 工艺:台积电3nm(N3P)先进工艺,采用SoIC 3D 堆叠封装,集成3360 亿晶体管。
- 架构:搭载第三代 Transformer 引擎,专为大模型推理与训练优化。
- 算力:NVFP4精度下推理算力50 PFLOPS(是上一代 Blackwell 的 5 倍);训练算力35 PFLOPS(3.5 倍)。
- 内存:288GB HBM4高带宽内存,单片带宽高达22TB/s(2.8 倍)。
- 互联:单 GPUNVLink 6带宽3.6TB/s。
- 成本:单 Token 生成成本降至 Blackwell 的 1/10。
- Vera CPU(英伟达首款服务器 CPU)
- 架构:自研 **ARMv9.2(Olympus)** 架构,88 核心 176 线程。
- 内存:全球首款数据中心级LPDDR5X CPU,支持最高1.5TB内存容量。
- 定位:专门负责 AI 任务调度、资源管理与智能体推理,性能较传统 x86 CPU 提升50%。
- 协同:通过NVLink-C2C与 Rubin GPU 实现 CPU-GPU 统一内存,数据移动效率翻倍。
- Groq 3 LPU(新增推理加速器)
- 来源:基于英伟达200 亿美元收购的 Groq 技术,本次 GTC 首次产品化落地。
- 定位:专用语言推理单元,作为 Rubin GPU 的 “推理协处理器”,专攻极低延迟、高并发的 Token 生成。
- 参数:内置4GB SRAM,SRAM 带宽1200TB/s(是 Rubin GPU 的 55 倍),单芯片算力9.6 PFLOPS。
- 组合:8 颗 LPU 可组成阵列,与 Vera Rubin 平台结合后,每兆瓦推理吞吐量最高提升 35 倍。
- NVLink 6 交换机芯片
- 功能:负责机架内 GPU 间的超高密度、低延迟互联。
- 性能:在标准NVL72机架中,提供260TB/s的内部总带宽。
- BlueField-4 DPU(数据处理单元)
- 功能:卸载并加速 AI 数据中心的网络、存储与安全任务,专门管理KV 缓存(键值缓存)。
- 内存:配备128GB独立内存。
- 效能:将 AI 推理吞吐量提升最高5 倍。
- ConnectX-9 SuperNIC(超级网卡)
- 速率:支持800Gb/s超高速网络。
- 协议:兼容InfiniBand & Ethernet双协议,为 AI 集群提供高速数据桥梁。
- Spectrum-6 交换机芯片
- 带宽:102.4Tb/s端口带宽。
- 技术:支持CPO(共封装光学),功耗较传统方案降低70%。
- 定位:用于超大规模 AI 集群的骨干组网,实现横向扩展。
旗舰系统:Vera Rubin NVL72 机架
- 配置:72 颗 Rubin GPU + 36 颗 Vera CPUNVIDIA。
- 总算力:NVFP4 推理 3.6 EFLOPS(3600 PFLOPS)NVIDIA。
- 部署:全温水液冷,数据中心部署时间从48 小时缩短至 2 小时。
- 量产:2026 年下半年开始大规模交付。
二、下一代架构:1.6nm Feynman(费曼)芯片提前亮相
核心定位:原定 2028 年发布的Feynman架构,本次提前两年曝光技术原型。这是全球首款1.6nm工艺、专为世界模型(World Model)与具身智能设计的芯片,旨在突破当前 AI 的物理极限。
革命性技术突破:
- 制程工艺:迈入 1nm 时代
- 工艺:采用台积电A16(1.6nm)“埃米级” 制程。
- 晶体管:**GAA(全环绕栅极)** 纳米片结构,替代传统 FinFET。
- 供电:超级电轨背面供电技术,将供电线路移至晶圆背面。
- 效能:同性能下功耗降低15%;同电压下速度提升8%-10%。
- 互连革命:硅光子光互连
- 技术:大规模商用硅光子(Silicon Photonics),用光信号替代铜缆电信号。
- 提升:带宽密度提升 10 倍,传输能耗降低 90%。
- 意义:彻底打破 “互连墙”,支撑百万 GPU 级超大规模集群协同。
- 架构创新:3D 堆叠异构集成
- 设计:将LPU 直接 3D 堆叠在 GPU 核心之上,数据传输距离极致缩短。
- 散热:采用培育钻石 + 液冷组合散热(钻石导热率是铜的 5 倍),应对 **2000W+** 的超高功耗。
战略意义:Feynman 不仅是芯片迭代,更是英伟达对 ** 通用人工智能(AGI)** 基础设施的提前布局。黄仁勋表示,该架构将支撑 AI 从 “理解语言” 走向 “理解、预测并交互物理世界”。
三、黄仁勋核心论断:万亿美元市场与 Token 经济学
- 万亿美金预测
- 规模:2025-2027 年期间,基于Blackwell 与 Rubin平台的相关收入将至少达到 1 万亿美元。
- 依据:“计算需求增长了100 万倍,我们正面临全球性的算力短缺。”
- Token 工厂经济学
- 核心观点:Token 就是新的货币,未来数据中心是生产 Token 的 “工厂”。
- 竞争关键:每瓦电力能产生多少 Token(即能效比),决定企业生死。
- Vera Rubin 价值:将 AI 的单位算力成本降至历史最低,让 Token “像空气一样便宜”。
相关新闻
从感知到播放:WT2003H语音芯片的智能集成,让传感器精准“开口说话”
智慧城市的无障碍通道传来“请注意安全”的提示,智能仓库在探测到移动时发出精准告警,这一切的背后,是传感器与语音播报的无缝融合。广州唯创电子推出的WT2003H高品质语音芯片,以其独特的“感知-播放”一体化设计,正为智能安防、节能控制等领域带来一场“省事又省钱”的技术革新。01 行业困境:感知与播报间的技术断层在传统的智能感知方案中,一个简单的语音提示功能往往需要复杂的硬件协同:传感器负责
2025-12-16
享誉全球的半导体产业盛会ICCAD-Expo(第31届)将于11月20日-21日在成都·中国西部国际博览城盛大召开,来自全球领先的Foundry、EDA、IP、设计服务、封测、设计企业及合作伙伴将欢聚成都,分享集成电路前沿技术与创新成果。 届时大会主席、中国半导体行业协会集成电路设计分会魏少军教授将分享《技术创新驱动设计产业升级》主旨报告,台积电、UMC和舰科技、中芯国际、华力、西门子EDA、三
2025-11-12
一、全球资本市场:存储股集体暴涨1. 韩国市场(核心主战场)SK 海力士:盘中涨幅一度突破13%,创年内单日最大涨幅纪录;港股相关杠杆 ETF(两倍做多海力士)大涨超21%。三星电子:盘中涨幅超10%,截至发稿当日涨幅达9.80%,报 190,500 韩元;机构目标价显示后续仍有 **31%** 上涨空间。2. A 股与港股市场A 股存储芯片板块:整体涨幅超2%,截至
2026-03-11
立即询价