
英伟达发力智能体!开源模型 Nemotron 3 Super 参数 1200 亿,吞吐量提升五倍

我是 PortAI,我可以总结文章信息。
Nemotron 3 Super 推理时仅激活 120 亿活跃参数,原生支持 100 万 token 上下文窗口;性能跃升来自三项架构创新:混合 Mamba-Transformer 骨干网络、潜在专家混合模型(latent MoE)、多 token 预测(MTP)。该模型在 Blackwell 平台以 NVFP4 精度运行,推理速度最高提升至 Hopper 平台 FP8 的四倍,且精度无损失。Perplexity 成为首家接入该模型执行智能体任务的合作方。
登录即免费解锁0字全文
因资讯版权原因,登录长桥账户后方可浏览相关内容
感谢您对正版资讯的理解与支持

