
GPT-4.5“既差還貴”,再不出 GPT-5,OpenAI 就難了

GPT-4.5 被認為是 “華而不實”,其性能不值如此高的價格。如果 OpenAI 不能儘快推出一個性能顯著提升的模型,關於其領先地位正在削弱的質疑聲將會越來越大。
憑藉 GPT 系列模型引領 AI 浪潮的 OpenAI,近日推出的 GPT-4.5 卻遭遇滑鐵盧。
這款被寄予厚望的新模型不僅性能不及預期,價格更是高得驚人。業界普遍認為,OpenAI 正面臨前所未有的壓力,如果不能儘快推出具有突破性的 GPT-5,其領先地位恐將不保。
高價低能,OpenAI 自降預期
AI 大模型競賽愈發白熱化,上週 OpenAI 推出了 GPT-4.5(Orion)大模型。
然而,與以往不同的是,OpenAI 此次刻意降低了市場對這款新模型的期望。OpenAI CEO Sam Altman 在社交平台 X 上表示,GPT-4.5 是一個 “巨大、昂貴的模型”,並且 “不會在基準測試中取得壓倒性優勢”。
OpenAI 自身的評估也顯示,GPT-4.5 在多項指標上不僅落後於 Anthropic 最新發布的 Claude 3.7 Sonnet,甚至不如 OpenAI 自家數月前推出的推理模型。
更令人咋舌的是,GPT-4.5 的定價高達每百萬輸入 tokens 75 美元,每百萬輸出 tokens 150 美元,是 GPT-4o 的 30 倍,Claude 3.7 Sonnet 的 10 倍以上。
儘管 GPT-4.5 在對話的真實性和幽默感方面有所提升,可能更適用於語音交互,但其整體性能顯然未能達到 OpenAI 最初的預期。The Information 指出,這可能是預訓練收益遞減的證據。
開發者們對 GPT-4.5 的反響普遍冷淡。AI 領域的知名評論家 Gary Marcus 直言 GPT-4.5 是 “nothingburger”(毫無價值的東西)。Ars Technica 援引一位匿名專家的話稱,GPT-4.5“華而不實”,其性能不值如此高的價格。
即使在 OpenAI 引以為傲的 “情感智能” 方面,GPT-4.5 也未能贏得廣泛認可。許多用户在社交平台上調侃, GPT-4.5 雖然情商高,但在工作上卻不那麼擅長,他們需要的是一個聰明的模型,而不是一個能理解他們感受的模型。
更令人擔憂的是,GPT-4.5 仍然存在幻覺和錯誤。據 MIT Technology Review 報道,OpenAI 自己也承認,GPT-4.5 在一個關鍵測試中仍然有 37% 的概率會 “編造事實”。
OpenAI 先發優勢消退
如果 OpenAI 不能儘快推出一個性能顯著提升的模型,關於其領先地位正在削弱的質疑聲將會越來越大。
此前,美國著名 TMT 投資人 Gavin Baker在一篇推文中表示,AI 產業格局的變革正在加速,OpenAI 的先發優勢消退,微軟也選擇後撤一步。
Gavin 在推文中指出:
當 ChatGPT 在 2022 年 11 月橫空出世時,OpenAI 通過激進押注 Scaling Law,在生成式 AI 領域建立了長達 7 個季度的統治地位。但這一優勢窗口正在關閉:Google 的 Gemini、xAI 的 Grok-3,以及 Deepseek 的最新模型,均已達到與 GPT-4 相近的技術水平。
就連 OpenAI 創始人 Altman 也指出,OpenAI 未來的領先優勢將更加狹窄;微軟 CEO 納德拉基本上表示,他們在模型能力方面領先的獨特時期即將結束。
面對 GPT-4.5 的困境,業界將目光投向了 OpenAI 的下一代模型 GPT-5,以及其 o3 推理模型。然而,OpenAI 在發佈新技術方面一向有 “預告” 的習慣,實際發佈時間往往滯後。
距離 OpenAI 宣佈 o3 的性能評估已經過去了兩個多月,但 Sam Altman 最近表示,o3 不會像 o1 那樣作為一個獨立的模型發佈。
儘管 Gavin 仍看好 OpenAI,但他預計,未來數據成為競爭核心,無法獲得獨特、有價值數據的前沿模型是歷史上貶值最快的資產。
在 AI 大模型競爭日益激烈的當下,單純依靠預訓練已經難以建立長期優勢。OpenAI 能否憑藉 GPT-5 重回巔峯,將取決於其在數據獲取、推理能力以及技術創新方面的突破。

