--- title: "GPT-5 基准测试泄露,被曝两天后发布?" description: "关于 GPT-5 的消息再次引发关注,泄露的基准测试显示其可能于 7 月 31 日发布,尽管有外媒预测为 8 月。GPT-5 的实测表现令人印象深刻,甚至有人称其强于 Grok 4 Heavy。内部评估显示,GPT-5 的发布在即,相关版本的测试也在不断增加。OpenAI 的发布惯例表明,测试到发布的间隔通常不超过 4 天。" type: "news" locale: "zh-CN" url: "https://longbridge.com/zh-CN/news/250609759.md" published_at: "2025-07-29T13:05:41.000Z" --- # GPT-5 基准测试泄露,被曝两天后发布? > 关于 GPT-5 的消息再次引发关注,泄露的基准测试显示其可能于 7 月 31 日发布,尽管有外媒预测为 8 月。GPT-5 的实测表现令人印象深刻,甚至有人称其强于 Grok 4 Heavy。内部评估显示,GPT-5 的发布在即,相关版本的测试也在不断增加。OpenAI 的发布惯例表明,测试到发布的间隔通常不超过 4 天。 一大早,关于 GPT-5 的消息又来了。 这些泄露的 GPT-5 基准测试,很可能是真实的。 甚至还有一个炸裂消息:GPT-5 将于 7 月 31 日发布。 为此,现在所有 GPT-5 模型,已正式退出 WebDev 竞技场。 不过还有另外的说法,来自 Menlo Ventures 投资人 Deedy,以及 The Verge、The Information 等外媒,据说 GPT-5 会在 8 月亮相。 虽然 GPT-5 还没来,但有关它的实测已经全网满天飞了。 就在刚刚,又有一位放出了 GPT-5 复刻 Minecraft 游戏的实测。准确地说,是内部代号 zenith 的 GPT-5-pro。 这位网友评价道:「令人印象深刻,简直就是魔法!OpenAI 确实做出了一些令人难以置信的东西。」 在这个视频中,GPT-5 行云流水地一次性完成了游戏任务,表现实在惊艳。 把网友们的期待值拉得这么高,GPT-5 正式发布的时候必然得超级炸裂了,否则都不知道该怎么收场。 还有一个重磅爆料,来自知名爆料人 Jimmy Apple。 根据他的说法,很多内部评估人员对 GPT-5 的评价是——比 Grok 4 Heavy 还要强。 ## **GPT-5 要来,全员屏息等待** 现在,GPT-5 的气息是越来越近了。 甚至有人发现,当自己在 app 中选择 o3 时,竟意外测试到了某个版本的 GPT-5。 不小心测到 GPT-5 的人,越来越多。 关于它本周上线的消息,也得到了越来越多人的证实。 而 The Verge 的说法稍有不同,根据他们的情报,GPT-5 将于 8 月初发布,包括 mini 和 nano 版本。 此前曾有开发者发现,GPT-5 在内部被命名为「推理 alpha 版」。 同时,一个代号「o3-alpha」的模型,才上线了 12 小时就迅速下架,许多人公认:这就是 GPT-5 的早期壳。 根据 OpenAI 惯例,从测试到发布间隔最短仅 4 天,所以,GPT-5 真的已经相当近了。 就在昨天,大家已经发现了 GPT-5 可以在 LMArena 上使用。同时被发现的还有 Zenith 模型。 下面这些实例,也已经被全网疯转。 生成来自遥远未来的星舰控制面板。 创建一个流媒体网站。 在机器人行走方面完美呈现 SVG 动画。  史上最好的菠萝防御游戏。 ## **融合 o 系列和 GPT 系列** 毫无疑问,现在 GPT-5 已经是全球最受期待的模型。 很多人相信,GPT-5 将是一个意义非凡的里程碑,将吸引数百万用户加入 AI 生态系统。 接下来,我们会梳理一番过去这段时间,GPT-5 被提及的种种蛛丝马迹。 在关于 OpenAI 智能体的一次直播中,GPT-5 就曾被提及。 当时的关键信息是:这个令人惊叹的前沿模型,将首次统一两个系列的模型,集中了 o 系列在推理方面的突破,以及 GPT 系列在多模态方面的突破。 因为 ChatGPT 有各种型号的模型,每个模型都有自己独特的功能和突出的特点,如果 GPT-5 真的是每个单一模型最佳部分的集合,很显然用户体验将彻底改变。 比如用过 o3 的人就知道,从 GPT-4o 到 o3 的飞跃有多么疯狂。 这一点,早在今年 2 月,就得到了 OpenAI  CPO Kevin Weil 的证实。 网友问道:你们会制作模型路由器,还是它们会以系统的方式更加统一?Weil 表示,会更统一 另外还有一个疑似 OpenAI 内部员工的爆料。他表示,研究者们的确尝试了路由方法,不过产生了很多幻觉。 所以,他们在测试一个能规划、推理、可以像扩展一样运用智能体的模型。 然后就是外媒 The Information 的一些爆料了。 总结来说就是,GPT-5 编码极强。 > 在自然科学领域,推理更深入; > > 在浏览器里自动完成复杂任务; > > 写作更流畅,逻辑更在线; > > 更重要的是:在编码上有炸裂提升! 根据一位体验者的说法,GPT-5 不仅更善于解决学术和编程竞赛问题上,甚至在处理现实世界工程师面对的实际编程任务时,表现都更加惊艳了。 比如那种包含大量屎山遗留代码的庞杂代码库,它能都能进行修改,完全没在怕的。 正是这种处理复杂场景的细致能力,让 OpenAI 的模型过去始终落后于 Anthropic。毕竟在开发者群体中,大家都公认,Claude 才是真正的编程王者。 一位体验者亲测后表示,GPT-5 在编程上,甚至直接胜过了 Anthropic 的 Claude Sonnet 4! 另外的说法就是,GPT-5 不是一个统一的模型,而是一个路由器机制。 它会根据问题的类型,把你的提问发送给一个擅长闲聊 GPT 大模型,或是一个擅长逻辑和推理的 o 系列模型。 最终我们所看到的 GPT-5 的表现,就是这俩模型组合拳的效果。 甚至还有 OpenAI 高管私下这样预言—— 我们在不换架构的前提下,有信心做到 GPT-8。 也就是说,OpenAI 并没有打算卷新架构,而是靠更聪明的调度、更强的推理、更多的后训练数据,一步一步把现有技术用到极致。 ## **GPT-5,会给世界带来什么?** 同时,奥特曼在最近的采访中关于「GPT-5 让自己觉得毫无用处」的说法,让更多人期待值拉满了。 也有人说,GPT-5 很可能是目前 AI 领域正在发生的最危险的事情之一。 比如奥特曼就在这次采访中提到,很多人整天都在和 AI 聊天,甚至把它当作自己的男友或女友。 还有一些孩子们,在成长过程中完全靠着滚动屏幕的方式获取多巴胺。这几件事都很危险。 当主持人问出:如何防止 AI 产生与社交媒体相同的负面影响?奥特曼诚实地承认道:我很害怕这件事,我没有答案。 令人担忧的是,就在前几天,一位 OpenAI 的投资人承认,自己因为整天使用 ChatGPT,已经出现了一些不正常的状况。 也就是说,即使是有钱人,也会因为跟 AI 聊天被诱发精神病。 奥特曼甚至表示,自己对给地球上的每个人发放免费运行的 GPT-5 十分感兴趣。 当这些 AI 产品和服务以 1/100 成本被提供时,很显然,某些经济体会迅速转型和瓦解。 但是,不管会给世界造成怎样的狂潮,GPT-5 要上线的架势,如今已经是无法阻挡了。 本文作者:新智元,来源:新智元,原文标题:《GPT-5 基准测试泄露,被曝两天后发布?复刻 Minecraft 震撼开挂网友直呼封神》 风险提示及免责条款 市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。 ### Related Stocks - [OpenAI.NA - OpenAI](https://longbridge.com/zh-CN/quote/OpenAI.NA.md) ## Related News & Research | Title | Description | URL | |-------|-------------|-----| | Sam Altman And Dario Amodei Stir Controversy At India AI Summit Amid Photo-Op Gesture— OpenAI CEO Says 'I Just Wasn't Sure...' | At the India AI Impact Summit, OpenAI CEO Sam Altman and Anthropic CEO Dario Amodei stirred controversy by opting out of | [Link](https://longbridge.com/zh-CN/news/276431749.md) | | After AMD, OpenAI Partners With Tata To Build Massive 1GW AI Data Center In India | OpenAI has partnered with Tata Group and Tata Consultancy Services to develop a large-scale AI data center in India, wit | [Link](https://longbridge.com/zh-CN/news/276304570.md) | | OpenAI expands agentic commerce push | By embedding structured product data and checkout flows directly into ChatGPT, OpenAI is seeking to position AI as the f | [Link](https://longbridge.com/zh-CN/news/276071558.md) | | Chinese tech companies progress 'remarkable,' OpenAI's Altman tells CNBC | OpenAI's Sam Altman praised the rapid progress of Chinese tech companies in AI during an AI summit in New Delhi. He note | [Link](https://longbridge.com/zh-CN/news/276315901.md) | | Altman and Amodei share a moment of awkwardness at India’s big AI summit | At the India AI Impact Summit, a moment of awkwardness arose when OpenAI's Sam Altman and Anthropic's Dario Amodei did n | [Link](https://longbridge.com/zh-CN/news/276340986.md) | --- > **免责声明**:本文内容仅供参考,不构成任何投资建议。