
英偉達全新開源模型:三倍吞吐、單卡可跑,還拿下推理 SOTA

我是 PortAI,我可以總結文章信息。
英偉達推出 Llama Nemotron Super v1.5 開源模型,專為複雜推理和智能體任務設計。該模型在科學、數學、編程等領域實現 SOTA 表現,吞吐量提升至前代的 3 倍,且可在單卡高效運行。採用神經架構搜索(NAS)技術,優化了準確率和效率,降低了運行成本。模型架構中包含跳過注意力機制和可變前饋網絡,提升了性能和效率。
登錄即免費解鎖0字全文
因資訊版權原因,登入長橋帳戶後方可瀏覽相關內容
多謝您對正版資訊的支持與理解

