Kimi 硬剛多模態滿血版 o1,首曝訓練細節!強化學習 scaling 新範式誕生

華爾街見聞
2025.01.21 00:16
portai
我是 PortAI,我可以總結文章信息。

Kimi 發佈了 k1.5 多模態思考模型,標誌着中文編程語言的崛起。該模型在 Long CoT 模式下的數學、代碼和多模態推理能力已達到 OpenAI o1 滿血版的水平,並在 Short CoT 模式下顯著領先於 GPT-4o 和 Claude 3.5。Kimi 團隊創新性地擴展了強化學習的應用,開闢了新的路徑,通過獎勵機制實現自主擴展訓練數據,推動計算規模的有效擴展。