--- title: "英偉達被撬牆角:OpenAI 首次發佈 Cerebras 芯片支持模型" type: "News" locale: "zh-HK" url: "https://longbridge.com/zh-HK/news/275817804.md" description: "OpenAI 週四發佈的 GPT-5.3-Codex-Spark 專為實時編碼設計,是 OpenAI 最新代碼自動化軟件 Codex 的精簡版,也是 OpenAI 上月與 Cerebras 簽署超 100 億美元協議後的首個成果。OpenAI 發言人稱,與英偉達的合作關係是 “基礎性的”,將持續評估所有用例中性價比最高的芯片,對於研究和推理等應用場景,GPU 仍是首選。" datetime: "2026-02-12T18:01:03.000Z" locales: - [zh-CN](https://longbridge.com/zh-CN/news/275817804.md) - [en](https://longbridge.com/en/news/275817804.md) - [zh-HK](https://longbridge.com/zh-HK/news/275817804.md) --- > 支持的語言: [简体中文](https://longbridge.com/zh-CN/news/275817804.md) | [English](https://longbridge.com/en/news/275817804.md) # 英偉達被撬牆角:OpenAI 首次發佈 Cerebras 芯片支持模型 OpenAI 正在減少對英偉達的依賴,本週四發佈了首個運行在 Cerebras Systems 芯片上的 AI 模型,標誌着這家 AI 明星在供應商多元化策略上邁出關鍵一步。此舉正逢 OpenAI 與英偉達關係微妙,雙方去年秋季宣佈的千億美元合作如今據稱陷入停滯。 GPT-5.3-Codex-Spark 專為實時編碼設計,是 OpenAI 最新代碼自動化軟件 Codex 的精簡版,旨在提供更快響應速度以換取部分性能。OpenAI 稱該模型生成速度比前代產品快 15 倍,每秒可輸出超過 1000 個 token。這是 OpenAI 2026 年 1 月與 Cerebras 簽署超過 100 億美元協議後的首個成果。 該模型率先向 ChatGPT Pro 訂閲用户開放研究預覽版,並通過 Codex 應用、命令行界面和 Visual Studio Code 擴展提供服務。OpenAI 表示,Codex 目前擁有超過 100 萬周活躍用户,過去十天下載量超過 100 萬次。 這一發布凸顯了 OpenAI 在 AI 編碼助手市場的競爭壓力。該公司正面臨來自谷歌、Anthropic 等對手的激烈競爭,同時還需應對內部安全團隊解散、研究人員離職以及在 ChatGPT 中引入廣告等爭議。 ## 速度提升伴隨性能妥協 Codex-Spark 代表 OpenAI 首個專為實時編碼協作打造的模型。該公司聲稱生成速度提升 15 倍,但拒絕提供具體延遲指標,如首 token 時間或每秒 token 數。 "我們無法分享具體延遲數字,但 Codex-Spark 經過優化,能夠提供近乎即時的感受——在保持真實編碼任務高度能力的同時,實現 15 倍更快的生成速度,"OpenAI 發言人表示。 這種速度提升以能力妥協為代價。在 SWE-Bench Pro 和 Terminal-Bench 2.0 這兩個評估 AI 系統自主執行復雜軟件工程任務能力的行業基準測試中,Codex-Spark 的表現不及完整版 GPT-5.3-Codex 模型。OpenAI 將此定位為可接受的權衡:開發者能夠獲得足夠快的響應以保持創作流暢性,即使底層模型無法處理最複雜的多步驟編程挑戰。 該模型配備 128000 個 token 的上下文窗口,僅支持文本輸入,不支持圖像或多模態輸入。小部分企業合作伙伴將獲得 API 訪問權限以評估集成可能性。OpenAI 計劃在未來幾周根據實際工作負載調整後擴大訪問範圍。 ## Cerebras 硬件消除傳統 GPU 集羣瓶頸 Codex-Spark 背後的技術架構反映出推理經濟學在 AI 公司擴展面向消費者產品時日益重要。Cerebras 的第三代晶圓級引擎是一塊約餐盤大小的單芯片,包含 4 萬億個晶體管,消除了 AI 工作負載分散到多個小型處理器集羣時產生的大量通信開銷。 對於訓練大規模模型,分佈式方法仍然必要,英偉達 GPU 在此表現出色。但對於推理——即生成用户查詢響應的過程——Cerebras 認為其架構可以以顯著更低的延遲交付結果。Cerebras 首席技術官兼聯合創始人 Sean Lie 將這一合作視為重塑開發者與 AI 系統交互方式的機會。 "GPT-5.3-Codex-Spark 最令我們興奮的是與 OpenAI 及開發者社區合作,探索快速推理帶來的可能性——新的交互模式、新的用例,以及根本不同的模型體驗,"Lie 在聲明中表示。"這次預覽僅僅是開始。" OpenAI 的基礎設施團隊並未將優化工作侷限於 Cerebras 硬件。該公司宣佈在整個推理堆棧中實現延遲改進,使所有 Codex 模型受益,包括持久 WebSocket 連接和 Responses API 內的優化。結果顯示:每次客户端 - 服務器往返開銷減少 80%,每 token 開銷減少 30%,首 token 時間減少 50%。 ## 與英偉達千億美元協議似乎停滯 鑑於 OpenAI 與英偉達之間日益複雜的關係,Cerebras 合作意義重大。 2025 年 9 月,英偉達與 OpenAI 宣佈簽署意向書確立達成戰略合作,OpenAI 將利用英偉達的系統打造和部署至少 10 千兆瓦(GW)的 AI 數據中心,使用數百萬塊英偉達的圖形處理器(GPU)訓練和部署 OpenAI 的下一代 AI 模型,英偉達則計劃對 OpenAI 投資最高 1000 億美元。這是英偉達迄今為止做出的最大手筆投資承諾。 以上戰略合作聲明似乎鞏固了全球最有價值 AI 公司與主導芯片供應商之間的戰略聯盟。 五個月後,據多個報道,上述鉅額交易已實質性停滯。英偉達 CEO 黃仁勳公開否認存在緊張關係,1 月下旬告訴記者"沒有戲劇性",英偉達仍致力於參與 OpenAI 當前融資輪。但雙方關係已明顯降温,評論認為摩擦源於多個方面。 OpenAI 積極尋求與替代芯片供應商的合作,包括與 Cerebras 的交易以及分別與 AMD 和博通簽署協議。2025 年 10 月,OpenAI 與英偉達競爭對手 AMD 達成重磅協議,將在多年內部署 6GW 的 AMD GPU。同月晚些時候,OpenAI 同意從博通購買定製芯片和網絡組件。 從英偉達角度看,OpenAI 可能正在利用其影響力將使其 AI 突破成為可能的硬件商品化。從 OpenAI 角度看,減少對單一供應商的依賴代表着審慎的商業策略。 OpenAI 發言人本週四告訴媒體,“將繼續與生態系統合作,持續評估所有用例中性價比最高的芯片”,“對於研究和推理等對成本敏感且以吞吐量為先的應用場景,GPU 仍然是我們的首選。” 這一聲明體現出避免激怒英偉達同時保留靈活性的謹慎努力,也反映出訓練前沿 AI 模型仍需要英偉達 GPU 提供的大規模並行處理能力。 OpenAI 發言人在週四的聲明中表示,OpenAI 與英偉達的合作關係是 “基礎性的”,OpenAI 最強大的 AI 模型是兩家公司 “多年來在硬件和軟件工程方面並肩合作” 的結果。“這就是為什麼我們將英偉達作為訓練和推理堆棧的核心,同時通過與 Cerebras、AMD 和博通的合作有意擴展其周圍的生態系統。” ## 內部動盪加劇外界審視 Codex-Spark 發佈之際,OpenAI 正應對一系列內部挑戰,加劇了外界對該公司方向和價值觀的審視。據本週報道,OpenAI 解散了其使命對齊團隊,該團隊於 2024 年 9 月成立,旨在推動公司確保通用人工智能造福人類的既定目標。團隊七名成員已被重新分配到其他崗位,負責人 Joshua Achiam 獲得"首席未來學家"的新頭銜。 OpenAI 此前在 2024 年解散了另一個關注安全的團隊——超級對齊團隊,該團隊專注於 AI 帶來的長期存在性風險。解散安全導向團隊的模式招致研究人員批評,他們認為 OpenAI 的商業壓力正在壓倒其最初的非營利使命。 該公司還面臨在 ChatGPT 中引入廣告決定帶來的後果。研究員 Zoë Hitzig 本週因她所描述的廣告支持 AI 的"滑坡效應"而辭職,在《紐約時報》撰文警告稱,ChatGPT 存檔的親密用户對話記錄為操縱創造了前所未有的機會。Anthropic 在超級碗廣告中趁機打出標語:"廣告正進入 AI。但不會進入 Claude。" 另外,該公司同意通過 Genai.mil 向五角大樓提供 ChatGPT,這是美國國防部的新項目,要求 OpenAI 允許"所有合法使用"而不受公司施加的限制——據報道 Anthropic 拒絕了這些條款。還有報道稱,曾對計劃中的露骨內容功能表達擔憂的 OpenAI 產品政策副總裁 Ryan Beiermeister 在 1 月份因歧視指控被解僱,她否認該指控。 ## AI 編碼助手市場競爭加劇 儘管周圍動盪不安,OpenAI 針對 Codex 的技術路線圖仍顯示出雄心勃勃的計劃。OpenAI 設想推出一種編碼助手,能夠無縫融合快速交互式編輯與長期運行的自主任務——一個既能處理快速修復,又能同時協調多個代理在後台處理更復雜問題的 AI。 OpenAI 發言人告訴媒體:“隨着時間推移,這些模式將融合——Codex 可以讓你保持緊密的交互循環,同時將長期運行的工作委派給後台子代理,或者在你需要廣度和速度時將任務並行分配給多個模型,這樣你就不必預先選擇單一模式。” 這一願景不僅需要更快的推理速度,還需要複雜的任務分解以及不同規模和能力模型之間的協調。Codex-Spark 為該體驗的交互部分建立了低延遲基礎;未來版本需要提供自主推理和多代理協調能力,才能實現完整願景。 目前,Codex-Spark 採用與其他 OpenAI 模型分開的速率限制,反映出研究預覽期間 Cerebras 基礎設施容量受限。"因為它運行在專門的低延遲硬件上,使用受單獨速率限制管控,在研究預覽期間可能根據需求調整,"發言人指出。這些限制被設計為"慷慨的",OpenAI 在決定如何擴展時監控使用模式。 Codex-Spark 的發佈正值 AI 驅動開發工具激烈競爭之際。Anthropic 的 Claude Cowork 產品上週引發傳統軟件股拋售,因投資者考慮 AI 助手是否可能取代傳統企業應用。微軟、谷歌和亞馬遜繼續在與各自雲平台集成的 AI 編碼能力上大舉投資。 OpenAI 的 Codex 應用自推出十天以來展現出快速採用勢頭,周活躍用户周環比增長 60%。目前超過 32.5 萬開發者在免費和付費層級積極使用 Codex。但 OpenAI 及更廣泛 AI 行業面臨的根本問題是,像 Codex-Spark 承諾的速度改進是否能轉化為有意義的生產力提升,還是僅僅創造更愉快的體驗而不改變結果。 Cerebras 交易是一個經過計算的賭注:專用硬件可以解鎖通用 GPU 無法經濟高效服務的用例。對於一家同時與競爭對手作戰、管理緊張供應商關係並應對內部對其商業方向異議的公司而言,這也提醒人們,在 AI 競賽中,原地不動不是選項。OpenAI 通過快速行動和打破常規建立了聲譽。現在它必須證明自己可以行動得更快——而不會破壞自己。 ### 相關股票 - [半導體 3 倍做多 - Direxion (SOXL.US)](https://longbridge.com/zh-HK/quote/SOXL.US.md) - [OpenAI (OpenAI.NA)](https://longbridge.com/zh-HK/quote/OpenAI.NA.md) - [標普半導體 ETF - SPDR (XSD.US)](https://longbridge.com/zh-HK/quote/XSD.US.md) - [動態半導體 ETF - Invesco (PSI.US)](https://longbridge.com/zh-HK/quote/PSI.US.md) - [英偉達期權收益策略 ETF - YieldMax (NVDY.US)](https://longbridge.com/zh-HK/quote/NVDY.US.md) - [英偉達 (NVDA.US)](https://longbridge.com/zh-HK/quote/NVDA.US.md) ## 相關資訊與研究 - [OpenAI 發布 GPT-5.3 Instant 能提供更準確答案](https://longbridge.com/zh-HK/news/277676370.md) - [OpenAI 年化收入超 250 億美元,Anthropic 報 190 億美元迎頭趕上](https://longbridge.com/zh-HK/news/277878313.md) - [投資 OpenAI|輝達千億投資 open AI 或「流產」外界揣測與 OpenAI 交惡有關 黃仁勳:投資計劃不太可能實現](https://longbridge.com/zh-HK/news/277889433.md) - [與戰爭部合作惹議!OpenAI 執行長認草率,協議增設監控保護措施](https://longbridge.com/zh-HK/news/277563451.md) - [OpenClaw 發布新版本,引入 OpenAI WebSocket 流式傳輸和 Claude4.6 自適應思考](https://longbridge.com/zh-HK/news/277417645.md)