英偉達發力智能體!開源模型 Nemotron 3 Super 參數 1200 億,吞吐量提升五倍

華爾街見聞
2026.03.11 16:02
portai
我是 PortAI,我可以總結文章信息。

Nemotron 3 Super 推理時僅激活 120 億活躍參數,原生支持 100 萬 token 上下文窗口;性能躍升來自三項架構創新:混合 Mamba-Transformer 骨幹網絡、潛在專家混合模型(latent MoE)、多 token 預測(MTP)。該模型在 Blackwell 平台以 NVFP4 精度運行,推理速度最高提升至 Hopper 平台 FP8 的四倍,且精度無損失。Perplexity 成為首家接入該模型執行智能體任務的合作方。