---
title: "GPT-5 基準測試泄露，被曝兩天後發佈？"
description: "關於 GPT-5 的消息再次引發關注，泄露的基準測試顯示其可能於 7 月 31 日發佈，儘管有外媒預測為 8 月。GPT-5 的實測表現令人印象深刻，甚至有人稱其強於 Grok 4 Heavy。內部評估顯示，GPT-5 的發佈在即，相關版本的測試也在不斷增加。OpenAI 的發佈慣例表明，測試到發佈的間隔通常不超過 4 天。"
type: "news"
locale: "zh-HK"
url: "https://longbridge.com/zh-HK/news/250609759.md"
published_at: "2025-07-29T13:05:41.000Z"
---

# GPT-5 基準測試泄露，被曝兩天後發佈？

> 關於 GPT-5 的消息再次引發關注，泄露的基準測試顯示其可能於 7 月 31 日發佈，儘管有外媒預測為 8 月。GPT-5 的實測表現令人印象深刻，甚至有人稱其強於 Grok 4 Heavy。內部評估顯示，GPT-5 的發佈在即，相關版本的測試也在不斷增加。OpenAI 的發佈慣例表明，測試到發佈的間隔通常不超過 4 天。

一大早，關於 GPT-5 的消息又來了。

這些泄露的 GPT-5 基準測試，很可能是真實的。

甚至還有一個炸裂消息：GPT-5 將於 7 月 31 日發佈。

為此，現在所有 GPT-5 模型，已正式退出 WebDev 競技場。

不過還有另外的説法，來自 Menlo Ventures 投資人 Deedy，以及 The Verge、The Information 等外媒，據説 GPT-5 會在 8 月亮相。

雖然 GPT-5 還沒來，但有關它的實測已經全網滿天飛了。

就在剛剛，又有一位放出了 GPT-5 復刻 Minecraft 遊戲的實測。準確地説，是內部代號 zenith 的 GPT-5-pro。

這位網友評價道：「令人印象深刻，簡直就是魔法！OpenAI 確實做出了一些令人難以置信的東西。」

在這個視頻中，GPT-5 行雲流水地一次性完成了遊戲任務，表現實在驚豔。

把網友們的期待值拉得這麼高，GPT-5 正式發佈的時候必然得超級炸裂了，否則都不知道該怎麼收場。

還有一個重磅爆料，來自知名爆料人 Jimmy Apple。

根據他的説法，很多內部評估人員對 GPT-5 的評價是——比 Grok 4 Heavy 還要強。

## **GPT-5 要來，全員屏息等待**

現在，GPT-5 的氣息是越來越近了。

甚至有人發現，當自己在 app 中選擇 o3 時，竟意外測試到了某個版本的 GPT-5。

不小心測到 GPT-5 的人，越來越多。

關於它本週上線的消息，也得到了越來越多人的證實。

而 The Verge 的説法稍有不同，根據他們的情報，GPT-5 將於 8 月初發布，包括 mini 和 nano 版本。

此前曾有開發者發現，GPT-5 在內部被命名為「推理 alpha 版」。

同時，一個代號「o3-alpha」的模型，才上線了 12 小時就迅速下架，許多人公認：這就是 GPT-5 的早期殼。

根據 OpenAI 慣例，從測試到發佈間隔最短僅 4 天，所以，GPT-5 真的已經相當近了。

就在昨天，大家已經發現了 GPT-5 可以在 LMArena 上使用。同時被發現的還有 Zenith 模型。

下面這些實例，也已經被全網瘋轉。

生成來自遙遠未來的星艦控制面板。

創建一個流媒體網站。

在機器人行走方面完美呈現 SVG 動畫。

 史上最好的菠蘿防禦遊戲。

## **融合 o 系列和 GPT 系列**

毫無疑問，現在 GPT-5 已經是全球最受期待的模型。

很多人相信，GPT-5 將是一個意義非凡的里程碑，將吸引數百萬用户加入 AI 生態系統。

接下來，我們會梳理一番過去這段時間，GPT-5 被提及的種種蛛絲馬跡。

在關於 OpenAI 智能體的一次直播中，GPT-5 就曾被提及。

當時的關鍵信息是：這個令人驚歎的前沿模型，將首次統一兩個系列的模型，集中了 o 系列在推理方面的突破，以及 GPT 系列在多模態方面的突破。

因為 ChatGPT 有各種型號的模型，每個模型都有自己獨特的功能和突出的特點，如果 GPT-5 真的是每個單一模型最佳部分的集合，很顯然用户體驗將徹底改變。

比如用過 o3 的人就知道，從 GPT-4o 到 o3 的飛躍有多麼瘋狂。

這一點，早在今年 2 月，就得到了 OpenAI  CPO Kevin Weil 的證實。

網友問道：你們會製作模型路由器，還是它們會以系統的方式更加統一？Weil 表示，會更統一

另外還有一個疑似 OpenAI 內部員工的爆料。他表示，研究者們的確嘗試了路由方法，不過產生了很多幻覺。

所以，他們在測試一個能規劃、推理、可以像擴展一樣運用智能體的模型。

然後就是外媒 The Information 的一些爆料了。

總結來説就是，GPT-5 編碼極強。

> 在自然科學領域，推理更深入；
> 
> 在瀏覽器裏自動完成複雜任務；
> 
> 寫作更流暢，邏輯更在線；
> 
> 更重要的是：在編碼上有炸裂提升！

根據一位體驗者的説法，GPT-5 不僅更善於解決學術和編程競賽問題上，甚至在處理現實世界工程師面對的實際編程任務時，表現都更加驚豔了。

比如那種包含大量屎山遺留代碼的龐雜代碼庫，它能都能進行修改，完全沒在怕的。

正是這種處理複雜場景的細緻能力，讓 OpenAI 的模型過去始終落後於 Anthropic。畢竟在開發者羣體中，大家都公認，Claude 才是真正的編程王者。

一位體驗者親測後表示，GPT-5 在編程上，甚至直接勝過了 Anthropic 的 Claude Sonnet 4！

另外的説法就是，GPT-5 不是一個統一的模型，而是一個路由器機制。

它會根據問題的類型，把你的提問發送給一個擅長閒聊 GPT 大模型，或是一個擅長邏輯和推理的 o 系列模型。

最終我們所看到的 GPT-5 的表現，就是這倆模型組合拳的效果。

甚至還有 OpenAI 高管私下這樣預言——

我們在不換架構的前提下，有信心做到 GPT-8。

也就是説，OpenAI 並沒有打算卷新架構，而是靠更聰明的調度、更強的推理、更多的後訓練數據，一步一步把現有技術用到極致。

## **GPT-5，會給世界帶來什麼？**

同時，奧特曼在最近的採訪中關於「GPT-5 讓自己覺得毫無用處」的説法，讓更多人期待值拉滿了。

也有人説，GPT-5 很可能是目前 AI 領域正在發生的最危險的事情之一。

比如奧特曼就在這次採訪中提到，很多人整天都在和 AI 聊天，甚至把它當作自己的男友或女友。

還有一些孩子們，在成長過程中完全靠着滾動屏幕的方式獲取多巴胺。這幾件事都很危險。

當主持人問出：如何防止 AI 產生與社交媒體相同的負面影響？奧特曼誠實地承認道：我很害怕這件事，我沒有答案。

令人擔憂的是，就在前幾天，一位 OpenAI 的投資人承認，自己因為整天使用 ChatGPT，已經出現了一些不正常的狀況。

也就是説，即使是有錢人，也會因為跟 AI 聊天被誘發精神病。

奧特曼甚至表示，自己對給地球上的每個人發放免費運行的 GPT-5 十分感興趣。

當這些 AI 產品和服務以 1/100 成本被提供時，很顯然，某些經濟體會迅速轉型和瓦解。

但是，不管會給世界造成怎樣的狂潮，GPT-5 要上線的架勢，如今已經是無法阻擋了。

本文作者：新智元，來源：新智元，原文標題：《GPT-5 基準測試泄露，被曝兩天後發佈？復刻 Minecraft 震撼開掛網友直呼封神》

風險提示及免責條款

市場有風險，投資需謹慎。本文不構成個人投資建議，也未考慮到個別用户特殊的投資目標、財務狀況或需要。用户應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資，責任自負。

### Related Stocks

- [OpenAI.NA - OpenAI](https://longbridge.com/zh-HK/quote/OpenAI.NA.md)

## Related News & Research

| Title | Description | URL |
|-------|-------------|-----|
| Sam Altman And Dario Amodei Stir Controversy At India AI Summit Amid Photo-Op Gesture— OpenAI CEO Says 'I Just Wasn't Sure...' | At the India AI Impact Summit, OpenAI CEO Sam Altman and Anthropic CEO Dario Amodei stirred controversy by opting out of | [Link](https://longbridge.com/zh-HK/news/276431749.md) |
| After AMD, OpenAI Partners With Tata To Build Massive 1GW AI Data Center In India | OpenAI has partnered with Tata Group and Tata Consultancy Services to develop a large-scale AI data center in India, wit | [Link](https://longbridge.com/zh-HK/news/276304570.md) |
| OpenAI expands agentic commerce push | By embedding structured product data and checkout flows directly into ChatGPT, OpenAI is seeking to position AI as the f | [Link](https://longbridge.com/zh-HK/news/276071558.md) |
| Chinese tech companies progress 'remarkable,' OpenAI's Altman tells CNBC | OpenAI's Sam Altman praised the rapid progress of Chinese tech companies in AI during an AI summit in New Delhi. He note | [Link](https://longbridge.com/zh-HK/news/276315901.md) |
| Altman and Amodei share a moment of awkwardness at India’s big AI summit | At the India AI Impact Summit, a moment of awkwardness arose when OpenAI's Sam Altman and Anthropic's Dario Amodei did n | [Link](https://longbridge.com/zh-HK/news/276340986.md) |

---

> **免責聲明**：本文內容僅供參考，不構成任何投資建議。