曦望發佈新一代推理芯片 S3

36Kr
2026.01.28 06:19
36 氪獲悉,國產 GPU 廠商曦望(Sunrise)發佈新一代推理芯片 S3。在算力與存儲設計上,S3 支持從 FP16 到 FP4 的精度自由切換,並率先在國內 GPGPU 產品中採用 LPDDR6 顯存方案,顯存容量較上一代提升 4 倍,緩解了大模型推理中常見的顯存瓶頸問題。在 DeepSeek 等主流大模型上,其單位 Token 推理成本較上一代降低約 90%。