
OpenAI 開源模型泄露:六大技術細節

我是 PortAI,我可以總結文章信息。
OpenAI 即將發佈的開源大模型技術細節泄露,包括一款 1200 億參數的混合專家模型和一款 200 億參數的稠密模型。前者在推理時激活約 50-60 億參數,提升推理效率並降低成本。模型可能採用 Float4 訓練技術,使用英偉達 Blackwell 芯片,激活函數為裁剪後的 SwiGLU,支持 128K 的上下文窗口,採用滑動窗口注意力機制。
登錄即免費解鎖0字全文
因資訊版權原因,登入長橋帳戶後方可瀏覽相關內容
多謝您對正版資訊的支持與理解

