--- title: "谷歌地表最强模型深夜来袭!Gemini 2.5 Pro 发布即屠榜,代码推理杀疯了" description: "谷歌发布了全新模型 Gemini 2.5 Pro,声称其为世界上最强大的模型,具备统一的推理能力和多项功能。该模型在多个基准测试中表现优异,尤其在 LMArena 中排名第一,分数比 Grok-3/GPT-4.5 高出 40 分。Gemini 2.5 Pro 在数学、创意写作等领域均夺得冠军,并在视觉和网页开发领域表现突出。该模型现已在 Google AI Studio 和 Gemini 应用中向" type: "news" locale: "zh-CN" url: "https://longbridge.com/zh-CN/news/233192568.md" published_at: "2025-03-26T00:41:19.000Z" --- # 谷歌地表最强模型深夜来袭!Gemini 2.5 Pro 发布即屠榜,代码推理杀疯了 > 谷歌发布了全新模型 Gemini 2.5 Pro,声称其为世界上最强大的模型,具备统一的推理能力和多项功能。该模型在多个基准测试中表现优异,尤其在 LMArena 中排名第一,分数比 Grok-3/GPT-4.5 高出 40 分。Gemini 2.5 Pro 在数学、创意写作等领域均夺得冠军,并在视觉和网页开发领域表现突出。该模型现已在 Google AI Studio 和 Gemini 应用中向用户开放,定价方案将于未来几周公布。 就在刚刚,谷歌的全新模型 Gemini 2.5 Pro,果然深夜上线了! Gemini 2.5 Pro 是一个「思考」模型,能够在回应前先进行思考推理,从而提升性能,并改善准确性。 谷歌称,它是世界上最强大的模型,具备统一的推理能力,以及用户所喜爱的 Gemini 的所有功能(长上下文、工具等)。 它在多个基准测试中达到了 SOTA 水平,并且以显著的优势在 LMArena 上排名第一。 现在,Gemini 2.5 Pro 已经登顶了 Arena 排行榜的第一位,而且创下了历史最大分数飞跃,比 Grok-3/GPT-4.5 整整高出了 40 分! 在代号「nebula」的测试中,它也横扫所有类别夺得第一,并且独揽数学、创意写作、指令遵循、长查询和多轮对话五大领域的冠军! 在困难提示词和编程两大领域,它与 Grok-3/GPT-4.5 拿到了并列冠军,而且在所有其他比拼中都以微弱优势胜出,成功问鼎榜首! 此外,Gemini 2.5 Pro 还成功登顶了视觉竞技场(Vision Arena)排行榜榜首! 在网页开发领域,它也同样大放异彩,成功斩获网页开发竞技场(WebDev Arena)亚军宝座! 它是首个实力媲美 Claude 3.5 Sonnet 的模型,相比之前版本的 Gemini 更是实现了质的飞跃。 这一次,谷歌的模型又展现出巨大的飞跃,OpenAI、Anthropic、DeepSeek 等竞争对手,在多久时间内会赶上? 目前,Gemini 2.5 Pro 已在 Google AI Studio 和 Gemini 应用中,向 Gemini Advanced 用户开放,并将很快在 Vertex AI 上推出。 而它的定价方案,会在未来几周内公布,用户可以在更高使用配额下,将模型应用于大规模生产环境。 网友实测后发现,它果然实力惊人,在所有模型中效果拔群,第一次尝试就只用几秒解决了一道难题。 ## Gemini 2.5 Pro 上线! 谷歌表示,在 AI 领域,系统的「推理」能力不仅仅指分类和预测,而是指系统分析信息、得出逻辑结论、融入上下文和细微差别,以及做出明智决策的能力。 长期以来,谷歌一直在探索通过强化学习和思维链提示词等技术,让 AI 更智能、更具推理能力的方法。 正是在此基础上,他们在 2 月推出了第一个思考模型,Gemini 2.0 Flash Thinking。 而今天,通过 Gemini 2.5,他们结合了显著增强的基础模型和改进的后期训练,让模型达到了新的性能水平。 **推理和代码能力大幅提升** Gemini 2.5 Pro 展现出了强大的推理和代码能力,在常见的编程、数学和科学基准测试中均处于领先地位。 另外,在各类需要高级推理能力的基准测试中,它都达到了 SOTA 水平。 无需使用测试阶段会增加计算成本的技术(如多数投票法),2.5 Pro 就能在 GPQA 和 AIME 2025 等数学和科学基准评测中表现卓越。 而且,在不使用任何外部工具的条件下,它就在挑战人类知识和推理能力的极限前沿「人类最后的考试」中取得了 18.8% 的准确率,达到业界领先。 在编程能力上,Gemini 2.5 相比 2.0 版本也实现了质的飞跃,而这,仅仅是个开始。 2.5 Pro 在创建视觉精美的网页应用和 AI 智能体代码应用方面都表现卓越,在代码转换和编辑领域中,也同样实力出色。 在智能体代码评估的行业标准测试 SWE-Bench Verified 上,Gemini 2.5 Pro 靠使用自定义智能体配置,就获得了 63.8% 的优异成绩。 以下这波 demo,就展示了 Gemini 2.5 Pro 如何运用强大推理,仅通过一行提示词,就能生成可执行代码,来创建完整的动画和游戏。 在下面这个 demo 中,仅仅根据下面这行 prompt,它就生成了一段 p5js 的交互式动画,展示了「宇宙鱼」的场景,并且还显示了鱼们都在想什么。 它还根据以下 prompt,生成了一个无限的恐龙跑酷游戏。 按照要求,它生成了像素化的恐龙图像和有趣的游戏背景。 随后,Gemini 2.5 Pro 还通过编程实现了分形可视化。 它创建出了精细分形图案的模拟程序,展现出了神奇的曼德布洛特集合。 此外,它还能构建一个交互式气泡图,直观展示出了每个大陆的经济与健康指标随时间的变化。 或者用一段交互式的 Javascript 动画,展示了旋转六边形内多彩的人工生命群体,并且按要求做成了「超新星星云」的感觉。 另外,它还能开发粒子系统模拟,给出了一个 HTML 文件,创造出了反射星云的沉浸式交互模拟场景。 **原生多模态和超长上下文** Gemini 2.5 继承并发扬了 Gemini 模型的优势——原生多模态能力和超长上下文长度。 自己发布之初,2.5 Pro 就支持 100 万 token 的上下文窗口(而 200 万 token 也即将推出!),性能显著超越了前代模型。 这能让它理解海量数据集,并处理来自多种信息源的复杂问题,包括文本、音频、图像、视频,甚至完整的代码仓库。 最后,既然谷歌已经掏出了地表最强模型,接下来,就让我们坐等 OpenAI 的反应了。 风险提示及免责条款 市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。 ### Related Stocks - [GOOGL.US - 谷歌-A](https://longbridge.com/zh-CN/quote/GOOGL.US.md) - [GOOG.US - 谷歌-C](https://longbridge.com/zh-CN/quote/GOOG.US.md) - [VERX.US - Vertex](https://longbridge.com/zh-CN/quote/VERX.US.md) - [OpenAI.NA - OpenAI](https://longbridge.com/zh-CN/quote/OpenAI.NA.md) - [603138.CN - 海量数据](https://longbridge.com/zh-CN/quote/603138.CN.md) ## Related News & Research | Title | Description | URL | |-------|-------------|-----| | YouTube Says Some Users Having Trouble Accessing Its Sites | By Kosaku Narioka Google-owned YouTube said some users were having trouble accessing the online video-sharing platform. | [Link](https://longbridge.com/zh-CN/news/276194395.md) | | 1 top quantum computing stock to buy in 2026 | Most quantum computing stocks are speculative buys, but not Alphabet. | [Link](https://longbridge.com/zh-CN/news/277068875.md) | | Belgian watchdog opens probe into Google's online ad price practices | Belgium's competition watchdog has launched an investigation into Google's online ad sales, citing serious indications o | [Link](https://longbridge.com/zh-CN/news/277213951.md) | | Google disrupts Chinese-linked hackers that attacked 53 groups globally | Google has disrupted the operations of a Chinese-linked hacking group, UNC2814, which breached 53 organizations across 4 | [Link](https://longbridge.com/zh-CN/news/276874342.md) | | Google legally reported user's child sex abuse images, Wisconsin court rules | The Wisconsin Supreme Court ruled that Google did not violate a user's rights when it reported child sexual abuse materi | [Link](https://longbridge.com/zh-CN/news/276776570.md) | --- > **免责声明**:本文内容仅供参考,不构成任何投资建议。