--- title: "GPT-5 基準測試泄露,被曝兩天後發佈?" description: "關於 GPT-5 的消息再次引發關注,泄露的基準測試顯示其可能於 7 月 31 日發佈,儘管有外媒預測為 8 月。GPT-5 的實測表現令人印象深刻,甚至有人稱其強於 Grok 4 Heavy。內部評估顯示,GPT-5 的發佈在即,相關版本的測試也在不斷增加。OpenAI 的發佈慣例表明,測試到發佈的間隔通常不超過 4 天。" type: "news" locale: "zh-HK" url: "https://longbridge.com/zh-HK/news/250609759.md" published_at: "2025-07-29T13:05:41.000Z" --- # GPT-5 基準測試泄露,被曝兩天後發佈? > 關於 GPT-5 的消息再次引發關注,泄露的基準測試顯示其可能於 7 月 31 日發佈,儘管有外媒預測為 8 月。GPT-5 的實測表現令人印象深刻,甚至有人稱其強於 Grok 4 Heavy。內部評估顯示,GPT-5 的發佈在即,相關版本的測試也在不斷增加。OpenAI 的發佈慣例表明,測試到發佈的間隔通常不超過 4 天。 一大早,關於 GPT-5 的消息又來了。 這些泄露的 GPT-5 基準測試,很可能是真實的。 甚至還有一個炸裂消息:GPT-5 將於 7 月 31 日發佈。 為此,現在所有 GPT-5 模型,已正式退出 WebDev 競技場。 不過還有另外的説法,來自 Menlo Ventures 投資人 Deedy,以及 The Verge、The Information 等外媒,據説 GPT-5 會在 8 月亮相。 雖然 GPT-5 還沒來,但有關它的實測已經全網滿天飛了。 就在剛剛,又有一位放出了 GPT-5 復刻 Minecraft 遊戲的實測。準確地説,是內部代號 zenith 的 GPT-5-pro。 這位網友評價道:「令人印象深刻,簡直就是魔法!OpenAI 確實做出了一些令人難以置信的東西。」 在這個視頻中,GPT-5 行雲流水地一次性完成了遊戲任務,表現實在驚豔。 把網友們的期待值拉得這麼高,GPT-5 正式發佈的時候必然得超級炸裂了,否則都不知道該怎麼收場。 還有一個重磅爆料,來自知名爆料人 Jimmy Apple。 根據他的説法,很多內部評估人員對 GPT-5 的評價是——比 Grok 4 Heavy 還要強。 ## **GPT-5 要來,全員屏息等待** 現在,GPT-5 的氣息是越來越近了。 甚至有人發現,當自己在 app 中選擇 o3 時,竟意外測試到了某個版本的 GPT-5。 不小心測到 GPT-5 的人,越來越多。 關於它本週上線的消息,也得到了越來越多人的證實。 而 The Verge 的説法稍有不同,根據他們的情報,GPT-5 將於 8 月初發布,包括 mini 和 nano 版本。 此前曾有開發者發現,GPT-5 在內部被命名為「推理 alpha 版」。 同時,一個代號「o3-alpha」的模型,才上線了 12 小時就迅速下架,許多人公認:這就是 GPT-5 的早期殼。 根據 OpenAI 慣例,從測試到發佈間隔最短僅 4 天,所以,GPT-5 真的已經相當近了。 就在昨天,大家已經發現了 GPT-5 可以在 LMArena 上使用。同時被發現的還有 Zenith 模型。 下面這些實例,也已經被全網瘋轉。 生成來自遙遠未來的星艦控制面板。 創建一個流媒體網站。 在機器人行走方面完美呈現 SVG 動畫。  史上最好的菠蘿防禦遊戲。 ## **融合 o 系列和 GPT 系列** 毫無疑問,現在 GPT-5 已經是全球最受期待的模型。 很多人相信,GPT-5 將是一個意義非凡的里程碑,將吸引數百萬用户加入 AI 生態系統。 接下來,我們會梳理一番過去這段時間,GPT-5 被提及的種種蛛絲馬跡。 在關於 OpenAI 智能體的一次直播中,GPT-5 就曾被提及。 當時的關鍵信息是:這個令人驚歎的前沿模型,將首次統一兩個系列的模型,集中了 o 系列在推理方面的突破,以及 GPT 系列在多模態方面的突破。 因為 ChatGPT 有各種型號的模型,每個模型都有自己獨特的功能和突出的特點,如果 GPT-5 真的是每個單一模型最佳部分的集合,很顯然用户體驗將徹底改變。 比如用過 o3 的人就知道,從 GPT-4o 到 o3 的飛躍有多麼瘋狂。 這一點,早在今年 2 月,就得到了 OpenAI  CPO Kevin Weil 的證實。 網友問道:你們會製作模型路由器,還是它們會以系統的方式更加統一?Weil 表示,會更統一 另外還有一個疑似 OpenAI 內部員工的爆料。他表示,研究者們的確嘗試了路由方法,不過產生了很多幻覺。 所以,他們在測試一個能規劃、推理、可以像擴展一樣運用智能體的模型。 然後就是外媒 The Information 的一些爆料了。 總結來説就是,GPT-5 編碼極強。 > 在自然科學領域,推理更深入; > > 在瀏覽器裏自動完成複雜任務; > > 寫作更流暢,邏輯更在線; > > 更重要的是:在編碼上有炸裂提升! 根據一位體驗者的説法,GPT-5 不僅更善於解決學術和編程競賽問題上,甚至在處理現實世界工程師面對的實際編程任務時,表現都更加驚豔了。 比如那種包含大量屎山遺留代碼的龐雜代碼庫,它能都能進行修改,完全沒在怕的。 正是這種處理複雜場景的細緻能力,讓 OpenAI 的模型過去始終落後於 Anthropic。畢竟在開發者羣體中,大家都公認,Claude 才是真正的編程王者。 一位體驗者親測後表示,GPT-5 在編程上,甚至直接勝過了 Anthropic 的 Claude Sonnet 4! 另外的説法就是,GPT-5 不是一個統一的模型,而是一個路由器機制。 它會根據問題的類型,把你的提問發送給一個擅長閒聊 GPT 大模型,或是一個擅長邏輯和推理的 o 系列模型。 最終我們所看到的 GPT-5 的表現,就是這倆模型組合拳的效果。 甚至還有 OpenAI 高管私下這樣預言—— 我們在不換架構的前提下,有信心做到 GPT-8。 也就是説,OpenAI 並沒有打算卷新架構,而是靠更聰明的調度、更強的推理、更多的後訓練數據,一步一步把現有技術用到極致。 ## **GPT-5,會給世界帶來什麼?** 同時,奧特曼在最近的採訪中關於「GPT-5 讓自己覺得毫無用處」的説法,讓更多人期待值拉滿了。 也有人説,GPT-5 很可能是目前 AI 領域正在發生的最危險的事情之一。 比如奧特曼就在這次採訪中提到,很多人整天都在和 AI 聊天,甚至把它當作自己的男友或女友。 還有一些孩子們,在成長過程中完全靠着滾動屏幕的方式獲取多巴胺。這幾件事都很危險。 當主持人問出:如何防止 AI 產生與社交媒體相同的負面影響?奧特曼誠實地承認道:我很害怕這件事,我沒有答案。 令人擔憂的是,就在前幾天,一位 OpenAI 的投資人承認,自己因為整天使用 ChatGPT,已經出現了一些不正常的狀況。 也就是説,即使是有錢人,也會因為跟 AI 聊天被誘發精神病。 奧特曼甚至表示,自己對給地球上的每個人發放免費運行的 GPT-5 十分感興趣。 當這些 AI 產品和服務以 1/100 成本被提供時,很顯然,某些經濟體會迅速轉型和瓦解。 但是,不管會給世界造成怎樣的狂潮,GPT-5 要上線的架勢,如今已經是無法阻擋了。 本文作者:新智元,來源:新智元,原文標題:《GPT-5 基準測試泄露,被曝兩天後發佈?復刻 Minecraft 震撼開掛網友直呼封神》 風險提示及免責條款 市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用户特殊的投資目標、財務狀況或需要。用户應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資,責任自負。 ### Related Stocks - [OpenAI.NA - OpenAI](https://longbridge.com/zh-HK/quote/OpenAI.NA.md) ## Related News & Research | Title | Description | URL | |-------|-------------|-----| | Sam Altman And Dario Amodei Stir Controversy At India AI Summit Amid Photo-Op Gesture— OpenAI CEO Says 'I Just Wasn't Sure...' | At the India AI Impact Summit, OpenAI CEO Sam Altman and Anthropic CEO Dario Amodei stirred controversy by opting out of | [Link](https://longbridge.com/zh-HK/news/276431749.md) | | After AMD, OpenAI Partners With Tata To Build Massive 1GW AI Data Center In India | OpenAI has partnered with Tata Group and Tata Consultancy Services to develop a large-scale AI data center in India, wit | [Link](https://longbridge.com/zh-HK/news/276304570.md) | | OpenAI expands agentic commerce push | By embedding structured product data and checkout flows directly into ChatGPT, OpenAI is seeking to position AI as the f | [Link](https://longbridge.com/zh-HK/news/276071558.md) | | Chinese tech companies progress 'remarkable,' OpenAI's Altman tells CNBC | OpenAI's Sam Altman praised the rapid progress of Chinese tech companies in AI during an AI summit in New Delhi. He note | [Link](https://longbridge.com/zh-HK/news/276315901.md) | | Altman and Amodei share a moment of awkwardness at India’s big AI summit | At the India AI Impact Summit, a moment of awkwardness arose when OpenAI's Sam Altman and Anthropic's Dario Amodei did n | [Link](https://longbridge.com/zh-HK/news/276340986.md) | --- > **免責聲明**:本文內容僅供參考,不構成任何投資建議。