曦望发布新一代推理GPU芯片,单位Token推理成本降低90%


国产GPU厂商曦望(Sunrise)重磅发布新一代推理GPU芯片——启望S3。这是曦望在近一年累计完成约30亿元战略融资后的首次集中公开亮相。2025年,曦望芯片交付量已突破万片。启望S3是专为大模型推理打造的定制化GPGPU芯片。在典型推理场景下,它的整体性价比较上一代提升超10倍。在算力与存储设计方面,该芯片支持FP16至FP4精度切换,采用LPDDR6显存方案,显存容量提升4倍,有效缓解了大

相关新闻


时钟芯片与晶振:核心差异与应用场景解析

你是否曾好奇过,手机、电脑甚至智能手表的时间为何能精准同步?这背后离不开两类关键元器件的协作:时钟芯片和晶振。尽管它们都与时间信号相关,但功能定位和技术原理却截然不同。本文将深入解析两者的区别,帮助读者理解它们在电子设备中的独特价值。一、基本定义:从本质理解差异时钟芯片(Clock Generator IC)是一种集成电路,负责生成、分配或调整系统所需的时钟信号。它通常包含锁相环(PLL)、分频器

2025-12-19

这家公司研发玻璃光计算芯片,算力超传统AI推理芯片千倍

光本位科技宣布正在用玻璃代替硅作为衬底来研制玻璃光计算芯片。在光本位科技此次突破之前,世界主流光计算公司普遍选择以硅为衬底制造光计算芯片。这是因为硅光平台与现有CMOS工艺之间几乎无缝兼容,具有较高的工艺成熟度和集成便利性。然而,纯硅调制存在诸多局限性,其中最为突出的是矩阵规模扩展困难。从64×64扩大至128×128的矩阵规模,竟然间隔了三年之久,这严重制约了光计算芯片性能的提升和应用的拓展。与

2026-01-19

曦望发布新一代推理GPU芯片,单位Token推理成本降低90%

国产GPU厂商曦望(Sunrise)重磅发布新一代推理GPU芯片——启望S3。这是曦望在近一年累计完成约30亿元战略融资后的首次集中公开亮相。2025年,曦望芯片交付量已突破万片。启望S3是专为大模型推理打造的定制化GPGPU芯片。在典型推理场景下,它的整体性价比较上一代提升超10倍。在算力与存储设计方面,该芯片支持FP16至FP4精度切换,采用LPDDR6显存方案,显存容量提升4倍,有效缓解了大

2026-01-29