Scaling Law 陷入困局,强化学习才是全村的希望?

虎嗅
2024.09.12 06:08
portai
我是 PortAI,我可以总结文章信息。

Scaling Law 面临瓶颈,强化学习被视为 AI 突破的关键。近期,AI 行业的 Q3 总结指出,预训练的 Scaling Law 已不再有效,80% 的公司可能放弃此策略。相反,Self-play RL 被认为是未来的希望,尤其在代码能力方面,Claude Sonnet 3.5 的表现超越了 GPT-4o,显示出 RL 的潜力。同时,OpenAI 即将发布新模型,ChatGPT Pro 订阅计划也已推出,售价 200 美金/月。