
終極測試成績創新高,谷歌 Gemini 3 深度思考模型重大升級,瞄準科研與工程應用

我是 PortAI,我可以總結文章信息。
在無工具輔助情況下,該模型在 “人類的最後考試”(HLE)基準測試中取得取得 48.4% 的正確率,在在 ARC-AGI-2 測試中獲得 84.6% 的成績;2025 年國際物理奧林匹克和化學奧林匹克的筆試部分均達到金牌水平。谷歌稱,新模型在推動發現並幫助研究人員解決 “不可解” 的問題——從發現研究論文中的缺陷到優化半導體晶體生長。
登錄即免費解鎖0字全文
因資訊版權原因,登入長橋帳戶後方可瀏覽相關內容
多謝您對正版資訊的支持與理解

