
OpenAI 开源模型泄露:六大技术细节

我是 PortAI,我可以总结文章信息。
OpenAI 即将发布的开源大模型技术细节泄露,包括一款 1200 亿参数的混合专家模型和一款 200 亿参数的稠密模型。前者在推理时激活约 50-60 亿参数,提升推理效率并降低成本。模型可能采用 Float4 训练技术,使用英伟达 Blackwell 芯片,激活函数为裁剪后的 SwiGLU,支持 128K 的上下文窗口,采用滑动窗口注意力机制。
登录即免费解锁0字全文
因资讯版权原因,登录长桥账户后方可浏览相关内容
感谢您对正版资讯的理解与支持

