谷歌 Gemini“悄悄變強”,快速縮小與 GPT-4o 差距,中文更是完成了超越!

華爾街見聞
2024.05.30 05:21
portai
我是 PortAI,我可以總結文章信息。

在中文測試中,Gemini Pro 和 Advanced 雙雙超越 GPT-4o,分別排在第一、第二位。

儘管亮相時被 OpenAI 壓了一頭,但谷歌一直在悄悄迭代 Gemini 大模型,和 OpenAI 最新大模型 GPT-4o 的差距已經顯著縮小。最新測試結果顯示,Gemini 1.5 Pro/Advanced 在綜合測試中排名第 2,逼近 GPT-4o,輕量版 Gemini 1.5 flash 排名第 9,超越 Llama-3-70b,接近 GPT-4。

相比 4 月份的版本,Gemini Pro 和 Flash 的能力有明顯加強。且上下文長度可以達到 100 萬 token,遠遠超出 GPT-4 的 12.8 萬 token。

Gemini 的中文能力更是驚豔,在中文測試中,Gemini Pro 和 Advanced 雙雙超越 GPT-4o,分別排在第一、第二位。

此外,在 Hard Prompts 測試中,Gemini 同樣名列前茅。在 Hard Prompts 測試中,大模型需要面對那些更具挑戰性的問題,Gemini 1.5 Pro 在這一測試中排名第二,僅次於 GPT-4o.

從大模型置信區間(Confidence Intervals)來看,Gemini 的測試結果也名列前茅。

值得一提的是,兩週前,在 Google Gemini 更新撞檔 GPT-4o 發佈時。Gemini 因為羸弱的能力幾乎引來了羣嘲。根據多家科技博客的測評,即使谷歌已經對 1.5 Pro 進行了數月的改進,但從常識推理到多模態能力和代碼能力,仍然無法與 OpenAI 最新的 GPT-4o 模型相媲美。唯一亮點就是更大的上下文窗口。如今谷歌 Gemini 取得了如此神速的進步,顯示出 AI 界屆黃埔軍校仍然有深厚的技術底藴。