英伟达 GTC 2026 大会(北京时间 3 月 17 日凌晨)核心发布:Vera Rubin 全平台与 1.6nm Feynman 芯片
发布时间:2026-03-18
一、Vera Rubin AI 计算平台:七芯协同,定义 AI 超算新标准发布背景:英伟达创始人兼 CEO 黄仁勋在 GTC 2026 主题演讲中正式发布Vera Rubin平台。这并非单一 GPU,而是英伟达从 “芯片公司” 转向 “AI 基础设施公司” 的战略级产品,是一套专为智能体(Agentic AI)与超大规模 AI 集群设计的完整系统。平台以已故天文学家薇拉・鲁宾(Vera
一、Vera Rubin AI 计算平台:七芯协同,定义 AI 超算新标准
发布背景:英伟达创始人兼 CEO 黄仁勋在 GTC 2026 主题演讲中正式发布Vera Rubin平台。这并非单一 GPU,而是英伟达从 “芯片公司” 转向 “AI 基础设施公司” 的战略级产品,是一套专为智能体(Agentic AI)与超大规模 AI 集群设计的完整系统。平台以已故天文学家薇拉・鲁宾(Vera Rubin)命名,寓意探索 AI 宇宙的 “暗物质”—— 极致算力。
核心构成:7 款全新芯片全解析该平台由 7 款深度协同的芯片组成,覆盖计算、互联、网络、存储全链路:
- Rubin GPU(算力核心)
- 工艺:台积电3nm(N3P)先进工艺,采用SoIC 3D 堆叠封装,集成3360 亿晶体管。
- 架构:搭载第三代 Transformer 引擎,专为大模型推理与训练优化。
- 算力:NVFP4精度下推理算力50 PFLOPS(是上一代 Blackwell 的 5 倍);训练算力35 PFLOPS(3.5 倍)。
- 内存:288GB HBM4高带宽内存,单片带宽高达22TB/s(2.8 倍)。
- 互联:单 GPUNVLink 6带宽3.6TB/s。
- 成本:单 Token 生成成本降至 Blackwell 的 1/10。
- Vera CPU(英伟达首款服务器 CPU)
- 架构:自研 **ARMv9.2(Olympus)** 架构,88 核心 176 线程。
- 内存:全球首款数据中心级LPDDR5X CPU,支持最高1.5TB内存容量。
- 定位:专门负责 AI 任务调度、资源管理与智能体推理,性能较传统 x86 CPU 提升50%。
- 协同:通过NVLink-C2C与 Rubin GPU 实现 CPU-GPU 统一内存,数据移动效率翻倍。
- Groq 3 LPU(新增推理加速器)
- 来源:基于英伟达200 亿美元收购的 Groq 技术,本次 GTC 首次产品化落地。
- 定位:专用语言推理单元,作为 Rubin GPU 的 “推理协处理器”,专攻极低延迟、高并发的 Token 生成。
- 参数:内置4GB SRAM,SRAM 带宽1200TB/s(是 Rubin GPU 的 55 倍),单芯片算力9.6 PFLOPS。
- 组合:8 颗 LPU 可组成阵列,与 Vera Rubin 平台结合后,每兆瓦推理吞吐量最高提升 35 倍。
- NVLink 6 交换机芯片
- 功能:负责机架内 GPU 间的超高密度、低延迟互联。
- 性能:在标准NVL72机架中,提供260TB/s的内部总带宽。
- BlueField-4 DPU(数据处理单元)
- 功能:卸载并加速 AI 数据中心的网络、存储与安全任务,专门管理KV 缓存(键值缓存)。
- 内存:配备128GB独立内存。
- 效能:将 AI 推理吞吐量提升最高5 倍。
- ConnectX-9 SuperNIC(超级网卡)
- 速率:支持800Gb/s超高速网络。
- 协议:兼容InfiniBand & Ethernet双协议,为 AI 集群提供高速数据桥梁。
- Spectrum-6 交换机芯片
- 带宽:102.4Tb/s端口带宽。
- 技术:支持CPO(共封装光学),功耗较传统方案降低70%。
- 定位:用于超大规模 AI 集群的骨干组网,实现横向扩展。
旗舰系统:Vera Rubin NVL72 机架
- 配置:72 颗 Rubin GPU + 36 颗 Vera CPUNVIDIA。
- 总算力:NVFP4 推理 3.6 EFLOPS(3600 PFLOPS)NVIDIA。
- 部署:全温水液冷,数据中心部署时间从48 小时缩短至 2 小时。
- 量产:2026 年下半年开始大规模交付。
二、下一代架构:1.6nm Feynman(费曼)芯片提前亮相
核心定位:原定 2028 年发布的Feynman架构,本次提前两年曝光技术原型。这是全球首款1.6nm工艺、专为世界模型(World Model)与具身智能设计的芯片,旨在突破当前 AI 的物理极限。
革命性技术突破:
- 制程工艺:迈入 1nm 时代
- 工艺:采用台积电A16(1.6nm)“埃米级” 制程。
- 晶体管:**GAA(全环绕栅极)** 纳米片结构,替代传统 FinFET。
- 供电:超级电轨背面供电技术,将供电线路移至晶圆背面。
- 效能:同性能下功耗降低15%;同电压下速度提升8%-10%。
- 互连革命:硅光子光互连
- 技术:大规模商用硅光子(Silicon Photonics),用光信号替代铜缆电信号。
- 提升:带宽密度提升 10 倍,传输能耗降低 90%。
- 意义:彻底打破 “互连墙”,支撑百万 GPU 级超大规模集群协同。
- 架构创新:3D 堆叠异构集成
- 设计:将LPU 直接 3D 堆叠在 GPU 核心之上,数据传输距离极致缩短。
- 散热:采用培育钻石 + 液冷组合散热(钻石导热率是铜的 5 倍),应对 **2000W+** 的超高功耗。
战略意义:Feynman 不仅是芯片迭代,更是英伟达对 ** 通用人工智能(AGI)** 基础设施的提前布局。黄仁勋表示,该架构将支撑 AI 从 “理解语言” 走向 “理解、预测并交互物理世界”。
三、黄仁勋核心论断:万亿美元市场与 Token 经济学
- 万亿美金预测
- 规模:2025-2027 年期间,基于Blackwell 与 Rubin平台的相关收入将至少达到 1 万亿美元。
- 依据:“计算需求增长了100 万倍,我们正面临全球性的算力短缺。”
- Token 工厂经济学
- 核心观点:Token 就是新的货币,未来数据中心是生产 Token 的 “工厂”。
- 竞争关键:每瓦电力能产生多少 Token(即能效比),决定企业生死。
- Vera Rubin 价值:将 AI 的单位算力成本降至历史最低,让 Token “像空气一样便宜”。
相关新闻
近日,国产人形机器人厂商优必选中标“自贡数投人形机器人数据采集中心项目设备采购”,中标产品为优必选最新款可自主换电的具身智能人形机器人Walker S2,采购金额达1.59亿,此次中标是9月份2.5亿全球单笔最大金额订单后,优必选Walker系列人形机器人斩获第二大订单。官方统计,截止目前,仅Walker系列人形机器人全年已累计突破8亿元订单。11月6日,在特斯拉股东大会上,马斯克表示,2026年
2025-11-13
进入2月,Arm、高通、AMD等芯片大厂相继发布了最新季度的财报,尽管从营收、利润上都获得可观的增长,高通甚至创下了季度新高,Arm、AMD营收也超出市场预期。然而三家芯片厂商对于下季度的业绩指引都不太乐观,财报过后股价均迎来大跌,AMD近两个交易日的跌幅更是接近20%。至于业绩指引不及预期的原因,从财报会议上看,罪魁祸首竟然是存储涨价。存储涨价拖累手机、PC市场需求高通在财报会议上表示,公司手机
2026-02-06
一、功率半导体:3 月 1 日起集体涨价,幅度 10% 起国内功率半导体龙头企业于 3 月 1 日同步执行涨价,核心覆盖 MOSFET、IGBT、小信号器件等品类,涨价直接源于上游原材料、晶圆代工及封测成本的持续攀升,叠加新能源汽车、工业控制、AI 服务器等下游需求旺盛,企业难以内部消化成本压力36氪。新洁能作为国内功率半导体设计龙头,自 3 月 1 日起对全系列 MOSFET 产品(含
2026-03-02
立即询价