36 氪获悉,国产 GPU 厂商曦望(Sunrise)发布新一代推理芯片 S3。在算力与存储设计上,S3 支持从 FP16 到 FP4 的精度自由切换,并率先在国内 GPGPU 产品中采用 LPDDR6 显存方案,显存容量较上一代提升 4 倍,缓解了大模型推理中常见的显存瓶颈问题。在 DeepSeek 等主流大模型上,其单位 Token 推理成本较上一代降低约 90%。