---
title: "GPT-5 基准测试泄露，被曝两天后发布？"
description: "关于 GPT-5 的消息再次引发关注，泄露的基准测试显示其可能于 7 月 31 日发布，尽管有外媒预测为 8 月。GPT-5 的实测表现令人印象深刻，甚至有人称其强于 Grok 4 Heavy。内部评估显示，GPT-5 的发布在即，相关版本的测试也在不断增加。OpenAI 的发布惯例表明，测试到发布的间隔通常不超过 4 天。"
type: "news"
locale: "zh-CN"
url: "https://longbridge.com/zh-CN/news/250609759.md"
published_at: "2025-07-29T13:05:41.000Z"
---

# GPT-5 基准测试泄露，被曝两天后发布？

> 关于 GPT-5 的消息再次引发关注，泄露的基准测试显示其可能于 7 月 31 日发布，尽管有外媒预测为 8 月。GPT-5 的实测表现令人印象深刻，甚至有人称其强于 Grok 4 Heavy。内部评估显示，GPT-5 的发布在即，相关版本的测试也在不断增加。OpenAI 的发布惯例表明，测试到发布的间隔通常不超过 4 天。

一大早，关于 GPT-5 的消息又来了。

这些泄露的 GPT-5 基准测试，很可能是真实的。

甚至还有一个炸裂消息：GPT-5 将于 7 月 31 日发布。

为此，现在所有 GPT-5 模型，已正式退出 WebDev 竞技场。

不过还有另外的说法，来自 Menlo Ventures 投资人 Deedy，以及 The Verge、The Information 等外媒，据说 GPT-5 会在 8 月亮相。

虽然 GPT-5 还没来，但有关它的实测已经全网满天飞了。

就在刚刚，又有一位放出了 GPT-5 复刻 Minecraft 游戏的实测。准确地说，是内部代号 zenith 的 GPT-5-pro。

这位网友评价道：「令人印象深刻，简直就是魔法！OpenAI 确实做出了一些令人难以置信的东西。」

在这个视频中，GPT-5 行云流水地一次性完成了游戏任务，表现实在惊艳。

把网友们的期待值拉得这么高，GPT-5 正式发布的时候必然得超级炸裂了，否则都不知道该怎么收场。

还有一个重磅爆料，来自知名爆料人 Jimmy Apple。

根据他的说法，很多内部评估人员对 GPT-5 的评价是——比 Grok 4 Heavy 还要强。

## **GPT-5 要来，全员屏息等待**

现在，GPT-5 的气息是越来越近了。

甚至有人发现，当自己在 app 中选择 o3 时，竟意外测试到了某个版本的 GPT-5。

不小心测到 GPT-5 的人，越来越多。

关于它本周上线的消息，也得到了越来越多人的证实。

而 The Verge 的说法稍有不同，根据他们的情报，GPT-5 将于 8 月初发布，包括 mini 和 nano 版本。

此前曾有开发者发现，GPT-5 在内部被命名为「推理 alpha 版」。

同时，一个代号「o3-alpha」的模型，才上线了 12 小时就迅速下架，许多人公认：这就是 GPT-5 的早期壳。

根据 OpenAI 惯例，从测试到发布间隔最短仅 4 天，所以，GPT-5 真的已经相当近了。

就在昨天，大家已经发现了 GPT-5 可以在 LMArena 上使用。同时被发现的还有 Zenith 模型。

下面这些实例，也已经被全网疯转。

生成来自遥远未来的星舰控制面板。

创建一个流媒体网站。

在机器人行走方面完美呈现 SVG 动画。

 史上最好的菠萝防御游戏。

## **融合 o 系列和 GPT 系列**

毫无疑问，现在 GPT-5 已经是全球最受期待的模型。

很多人相信，GPT-5 将是一个意义非凡的里程碑，将吸引数百万用户加入 AI 生态系统。

接下来，我们会梳理一番过去这段时间，GPT-5 被提及的种种蛛丝马迹。

在关于 OpenAI 智能体的一次直播中，GPT-5 就曾被提及。

当时的关键信息是：这个令人惊叹的前沿模型，将首次统一两个系列的模型，集中了 o 系列在推理方面的突破，以及 GPT 系列在多模态方面的突破。

因为 ChatGPT 有各种型号的模型，每个模型都有自己独特的功能和突出的特点，如果 GPT-5 真的是每个单一模型最佳部分的集合，很显然用户体验将彻底改变。

比如用过 o3 的人就知道，从 GPT-4o 到 o3 的飞跃有多么疯狂。

这一点，早在今年 2 月，就得到了 OpenAI  CPO Kevin Weil 的证实。

网友问道：你们会制作模型路由器，还是它们会以系统的方式更加统一？Weil 表示，会更统一

另外还有一个疑似 OpenAI 内部员工的爆料。他表示，研究者们的确尝试了路由方法，不过产生了很多幻觉。

所以，他们在测试一个能规划、推理、可以像扩展一样运用智能体的模型。

然后就是外媒 The Information 的一些爆料了。

总结来说就是，GPT-5 编码极强。

> 在自然科学领域，推理更深入；
> 
> 在浏览器里自动完成复杂任务；
> 
> 写作更流畅，逻辑更在线；
> 
> 更重要的是：在编码上有炸裂提升！

根据一位体验者的说法，GPT-5 不仅更善于解决学术和编程竞赛问题上，甚至在处理现实世界工程师面对的实际编程任务时，表现都更加惊艳了。

比如那种包含大量屎山遗留代码的庞杂代码库，它能都能进行修改，完全没在怕的。

正是这种处理复杂场景的细致能力，让 OpenAI 的模型过去始终落后于 Anthropic。毕竟在开发者群体中，大家都公认，Claude 才是真正的编程王者。

一位体验者亲测后表示，GPT-5 在编程上，甚至直接胜过了 Anthropic 的 Claude Sonnet 4！

另外的说法就是，GPT-5 不是一个统一的模型，而是一个路由器机制。

它会根据问题的类型，把你的提问发送给一个擅长闲聊 GPT 大模型，或是一个擅长逻辑和推理的 o 系列模型。

最终我们所看到的 GPT-5 的表现，就是这俩模型组合拳的效果。

甚至还有 OpenAI 高管私下这样预言——

我们在不换架构的前提下，有信心做到 GPT-8。

也就是说，OpenAI 并没有打算卷新架构，而是靠更聪明的调度、更强的推理、更多的后训练数据，一步一步把现有技术用到极致。

## **GPT-5，会给世界带来什么？**

同时，奥特曼在最近的采访中关于「GPT-5 让自己觉得毫无用处」的说法，让更多人期待值拉满了。

也有人说，GPT-5 很可能是目前 AI 领域正在发生的最危险的事情之一。

比如奥特曼就在这次采访中提到，很多人整天都在和 AI 聊天，甚至把它当作自己的男友或女友。

还有一些孩子们，在成长过程中完全靠着滚动屏幕的方式获取多巴胺。这几件事都很危险。

当主持人问出：如何防止 AI 产生与社交媒体相同的负面影响？奥特曼诚实地承认道：我很害怕这件事，我没有答案。

令人担忧的是，就在前几天，一位 OpenAI 的投资人承认，自己因为整天使用 ChatGPT，已经出现了一些不正常的状况。

也就是说，即使是有钱人，也会因为跟 AI 聊天被诱发精神病。

奥特曼甚至表示，自己对给地球上的每个人发放免费运行的 GPT-5 十分感兴趣。

当这些 AI 产品和服务以 1/100 成本被提供时，很显然，某些经济体会迅速转型和瓦解。

但是，不管会给世界造成怎样的狂潮，GPT-5 要上线的架势，如今已经是无法阻挡了。

本文作者：新智元，来源：新智元，原文标题：《GPT-5 基准测试泄露，被曝两天后发布？复刻 Minecraft 震撼开挂网友直呼封神》

风险提示及免责条款

市场有风险，投资需谨慎。本文不构成个人投资建议，也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资，责任自负。

### Related Stocks

- [OpenAI.NA - OpenAI](https://longbridge.com/zh-CN/quote/OpenAI.NA.md)

## Related News & Research

| Title | Description | URL |
|-------|-------------|-----|
| Sam Altman And Dario Amodei Stir Controversy At India AI Summit Amid Photo-Op Gesture— OpenAI CEO Says 'I Just Wasn't Sure...' | At the India AI Impact Summit, OpenAI CEO Sam Altman and Anthropic CEO Dario Amodei stirred controversy by opting out of | [Link](https://longbridge.com/zh-CN/news/276431749.md) |
| After AMD, OpenAI Partners With Tata To Build Massive 1GW AI Data Center In India | OpenAI has partnered with Tata Group and Tata Consultancy Services to develop a large-scale AI data center in India, wit | [Link](https://longbridge.com/zh-CN/news/276304570.md) |
| OpenAI expands agentic commerce push | By embedding structured product data and checkout flows directly into ChatGPT, OpenAI is seeking to position AI as the f | [Link](https://longbridge.com/zh-CN/news/276071558.md) |
| Chinese tech companies progress 'remarkable,' OpenAI's Altman tells CNBC | OpenAI's Sam Altman praised the rapid progress of Chinese tech companies in AI during an AI summit in New Delhi. He note | [Link](https://longbridge.com/zh-CN/news/276315901.md) |
| Altman and Amodei share a moment of awkwardness at India’s big AI summit | At the India AI Impact Summit, a moment of awkwardness arose when OpenAI's Sam Altman and Anthropic's Dario Amodei did n | [Link](https://longbridge.com/zh-CN/news/276340986.md) |

---

> **免责声明**：本文内容仅供参考，不构成任何投资建议。