新版 Gemini 2.5 拿下所有榜一,谷歌无敌了!一个月全面击败 o3,编程反超 Claude 4

华尔街见闻
2025.06.06 04:46
portai
我是 PortAI,我可以总结文章信息。

谷歌推出新版 Gemini 2.5 Pro,迅速在各项基准测试中取得领先,全面击败 o3 和 Claude 4。新模型在数学、编程和推理测试中刷新 SOTA,Elo 评分提升 24 分,Web Arena 上更是提升 35 分。Gemini 2.5 Pro 保持原价,性价比高,且引入了「思考预算」等新功能,预计几周后将成为稳定版本,适合企业级应用。