英伟达全新开源模型:三倍吞吐、单卡可跑,还拿下推理 SOTA

华尔街见闻
2025.07.29 07:10
portai
我是 PortAI,我可以总结文章信息。

英伟达推出 Llama Nemotron Super v1.5 开源模型,专为复杂推理和智能体任务设计。该模型在科学、数学、编程等领域实现 SOTA 表现,吞吐量提升至前代的 3 倍,且可在单卡高效运行。采用神经架构搜索(NAS)技术,优化了准确率和效率,降低了运行成本。模型架构中包含跳过注意力机制和可变前馈网络,提升了性能和效率。