新版 Gemini 2.5 拿下所有榜一,谷歌無敵了!一個月全面擊敗 o3,編程反超 Claude 4

華爾街見聞
2025.06.06 04:46
portai
我是 PortAI,我可以總結文章信息。

谷歌推出新版 Gemini 2.5 Pro,迅速在各項基準測試中取得領先,全面擊敗 o3 和 Claude 4。新模型在數學、編程和推理測試中刷新 SOTA,Elo 評分提升 24 分,Web Arena 上更是提升 35 分。Gemini 2.5 Pro 保持原價,性價比高,且引入了「思考預算」等新功能,預計幾周後將成為穩定版本,適合企業級應用。