終極測試成績創新高,谷歌 Gemini 3 深度思考模型重大升級,瞄準科研與工程應用

華爾街見聞
2026.02.12 19:11
portai
我是 PortAI,我可以總結文章信息。

在無工具輔助情況下,該模型在 “人類的最後考試”(HLE)基準測試中取得取得 48.4% 的正確率,在在 ARC-AGI-2 測試中獲得 84.6% 的成績;2025 年國際物理奧林匹克和化學奧林匹克的筆試部分均達到金牌水平。谷歌稱,新模型在推動發現並幫助研究人員解決 “不可解” 的問題——從發現研究論文中的缺陷到優化半導體晶體生長。