英偉達全新開源模型:三倍吞吐、單卡可跑,還拿下推理 SOTA

華爾街見聞
2025.07.29 07:10
portai
我是 PortAI,我可以總結文章信息。

英偉達推出 Llama Nemotron Super v1.5 開源模型,專為複雜推理和智能體任務設計。該模型在科學、數學、編程等領域實現 SOTA 表現,吞吐量提升至前代的 3 倍,且可在單卡高效運行。採用神經架構搜索(NAS)技術,優化了準確率和效率,降低了運行成本。模型架構中包含跳過注意力機制和可變前饋網絡,提升了性能和效率。