Scaling Law 陷入困局,強化學習才是全村的希望?

虎嗅
2024.09.12 06:08
portai
我是 PortAI,我可以總結文章信息。

Scaling Law 面臨瓶頸,強化學習被視為 AI 突破的關鍵。近期,AI 行業的 Q3 總結指出,預訓練的 Scaling Law 已不再有效,80% 的公司可能放棄此策略。相反,Self-play RL 被認為是未來的希望,尤其在代碼能力方面,Claude Sonnet 3.5 的表現超越了 GPT-4o,顯示出 RL 的潛力。同時,OpenAI 即將發佈新模型,ChatGPT Pro 訂閲計劃也已推出,售價 200 美金/月。