OpenAI 開源模型泄露:六大技術細節

華爾街見聞
2025.08.01 23:40
portai
我是 PortAI,我可以總結文章信息。

OpenAI 即將發佈的開源大模型技術細節泄露,包括一款 1200 億參數的混合專家模型和一款 200 億參數的稠密模型。前者在推理時激活約 50-60 億參數,提升推理效率並降低成本。模型可能採用 Float4 訓練技術,使用英偉達 Blackwell 芯片,激活函數為裁剪後的 SwiGLU,支持 128K 的上下文窗口,採用滑動窗口注意力機制。