
谷歌推出 Gemini 2.5 Pro 升级预览版 编码能力有所提升

谷歌宣布推出 Gemini 2.5 Pro(I/O 版) 的升级预览版,提升了编码能力,特别是在构建交互式网络应用方面。新版本将在几周内成为稳定版,供企业使用。最新模型在 LMArena 和 WebDevArena 的 Elo 得分均有所上升,继续在高难度编码基准测试中表现出色。Gemini 的竞争对手包括 OpenAI、Meta 和 Anthropic 等公司的 AI 产品。
智通财经 APP 获悉,Alphabet(GOOGL.US) 旗下的谷歌表示,将推出 Gemini 2.5 Pro(I/O 版) 的升级预览版,该版本提高了编码能力,尤其是构建引人注目的交互式网络应用程序的能力。
上个月,该公司表示将为开发人员发布 Gemini 2.5 Pro 预览版 (I/O 版) 的早期访问权限,这是 2.5 Pro 的更新版本。
谷歌周四表示,新模型将以 5 月份发布并在 I/O 大会上展示的版本为基础,将在几周内成为普遍可用的稳定版本,可供企业级应用使用。
根据谷歌的说法,最新的 2.5 Pro 在 LMArena 上的 Elo 得分上升了 24 分,保持了其在排行榜上的领先地位,在 WebDevArena 上的 Elo 得分上升了 35 分,以 1443 分领先。
谷歌产品管理高级总监 Tulsee Doshi 周四表示:“它在编码方面继续表现出色,在 Aider Polyglot 等高难度编码基准测试中保持领先。此外,它在 GPQA 和 Humanity's Last Exam (HLE) 等极具挑战性的基准测试中也表现出色,这些基准测试评估了模型的数学、科学、知识和推理能力。”
Gemini 的竞争对手包括微软支持的 OpenAI、Meta Platforms 和 Anthropic 等公司的人工智能产品。
周四早些时候,由亚马逊和谷歌支持的 Anthropic 发布了专门为美国国家安全客户打造的 Claude Gov 模型。
今年 4 月,Facebook 的母公司 Meta 发布了一款基于 Llama 4 LLM 的新独立应用,将与 Gemini、ChatGPT、DeepSeek 和 xAI 的 Grok 等其他聊天机器人应用展开竞争。

