小米最新大模型成果!羅福莉現身了

華爾街見聞
2025.10.17 06:00
portai
我是 PortAI,我可以總結文章信息。

小米 AI 團隊與北京大學聯合發佈了一篇關於 MoE 與強化學習的論文,羅福莉作為通訊作者參與其中。論文提出了一種在 MoE 架構中提高大模型強化學習效率與穩定性的思路,解決了訓練過程中的不穩定問題。該研究表明,強化學習在推動大模型能力突破方面至關重要,尤其是在預訓練遇到瓶頸時。