OpenAI 的奇點時刻

當 OpenAI 首席技術官米拉·穆拉提發佈桌面版本的 ChatGPT 和新的旗艦模型—GPT-4o，OpenAI 的發展，進入到了一個真正意義上的奇點時刻。

OpenAI 的短短 26 分鐘的發佈會，卻依然引發了不少波瀾。

無論是 ChatGPT-4o 的完全免費，抑或是推出 PC 桌面版的 ChatGPT，無一不為我們顯示出 OpenAI 的領先。

然而，如果僅僅只是一味地尬吹 OpenAI 的領先，必然是沒有太多裨益的。

原因在於，OpenAI 的確在很多方面具備着相對領先的優勢，這樣一種領先，並不僅僅只是體現在它與谷歌的差距上，同樣還體現在它與中國 AI 玩家們的差距上。

透過 OpenAI 的發佈會，我們需要更多地看到的是，時下的 AI 行業，正在發生着的深刻變化，並由此來找到適合當下發展趨勢的新機會。

如果一定要找到 OpenAI 的這場短短髮佈會帶給我們的啓示的話，我更加願意將其看成是 AI 正走在互聯網道路上的一種直接體現。

以此為開端，AI 將會真正從一個侷限於實驗室裏的存在，成為一個被越來越多的大眾所認識、所使用、所接受的存在。

如果我們將 ChatGPT-4o 之前的 OpenAI，看成是一個佈道者的話，那麼，ChatGPT-4o 之後的 OpenAI，則更像是一個實踐者。

一句話，OpenAI 正在 open AI。

未來，我們將會看到越來越多的場景和行業當中，開始出現 AI 的影子，我們將會看到越來越多的玩家們，開始加入到普及與落地 AI 的過程當中。

認識到這一點，我們或許才能更好地把握 OpenAI 這樣一個短短 26 分鐘的發佈會，帶給我們的更深層次的意義。

一

OpenAI 這樣一個發佈會扔出的「王炸」，其實就是推出了 ChatGPT-4o 這樣一個完全免費的應用。

從表面上來看，OpenAI 之所以會進行完全免費，其中一個很重要的原因在於，它的用户的增長業已進入到瓶頸期，為了拓展更多的用户，OpenAI 便開始通過免費的方式來獲得新的用户。

自去年 ChatGPT 推出後，在 2023 年 5 月達到流量峯值，網絡訪問量達到 18 億次，但之後流量出現下滑情況。2024 年 3 月，ChatGPT 的訪問量依然穩定在了 18 億次，不再有明顯增長。

當 OpenAI 通過 ChatGPT-4o 完全免費進一步降低使用門檻，首先起到立竿見影效果的，便是用户量的增長。

對於業已陷入到用户增長瓶頸期的 OpenAI 來講，無疑是一個非常不錯的嘗試。

如果我們將 ChatGPT-4o 的完全免費，看成是 OpenAI 為了提升用户量所做的一次嘗試的話，那麼，ChatGPT-4o 此次將更多的場景應用到端側模式以及代碼生成能力的場景應用，則是將 OpenAI 的用户量的增長拓展到了更為廣闊的領域之中。

這其實是和互聯網行業的發展，有着異曲同工之處的。

我們都知道，早在互聯網尚未風靡的時候，人們對於互聯網的使用，並不是像現在這樣普及，甚至在很多情況下，人們對於互聯網的使用，如同現在人們對於 AI 的使用一樣，必須要付費。

很顯然，通過付費的方式，很難讓互聯網釋放出更大的發展潛能，很難成就一個叫做「互聯網」的時代的。

於是，為了讓互聯網釋放出更大的發展潛能，為了讓互聯網真正成就一個時代，必然需要做的，便是將以往收費的互聯網服務進行免費，並且真正用這樣一種方式來實現互聯網的最大限度的普及。在此基礎上，我們再去尋找「互聯網 +」的商業模式。

可以説，免費，真正讓互聯網成為了一種「基礎設施」，而免費同樣促進了「互聯網 +」模式的不斷成熟和完善。

對標到 AI 的身上，其實同樣如此。

毋庸置疑的是，OpenAI 通過 ChatGPT 讓我們看到了 AI 的強大，讓我們看到了對於效率提升的積極影響。

然而，在很多時候，人們對於 AI 的感知依然是在收費的情況下完成的，依然是受到收費的掣肘的。

在這樣一種情況下，AI 很難成為一種基礎設施，更加難以釋放出新的更大的發展潛能的。

因此，如果一定要找到 AI 走在互聯網上道路上的具體表現的話，完全免費，並以此來促成 AI 最大限度的普及，並以此來孕育出更多新的商業模式，無疑是最直接的表現。

當 OpenAI 撕開了免費的口子，我們或許還將會在未來看到更多玩家加入其中，從而真正將人們帶入到人人皆可使用 AI，萬物皆可 AI 的全新發展階段。

二

除了 ChatGPT-4o 的完全免費之外，OpenAI 在發佈會上更多地為我們展示的是，GPT-4o 的模型能力、基準測試、模型安全性和侷限性。

模型能力上，在 GPT-4o 之前，ChatGPT 語音模式對話的平均延遲為 2.8 秒 (GPT-3.5) 和 5.4 秒 (GPT-4)。

如今藉助 GPT-4o，OpenAI 跨文本、視覺和音頻端到端地訓練了一個新模型，這意味着所有輸入和輸出都由同一神經網絡處理。

傳統基準測試層面上，GPT-4o 在文本、推理和編碼智能方面實現了 GPT-4 Turbo 級別的性能，同時在多語言、音頻和視覺功能上均處於高位。

在 5 次 MMLU（常識問題）上，GPT-4o 創下了 87.2% 的新高分，遠超谷歌 Gemini Pro 1.5、Ultra 1.0，以及自己的 GPT-4T 和 GPT-4 等。

模型安全性和侷限性上，GPT-4o 通過過濾訓練數據和通過訓練後細化模型行為等技術，在跨模式設計中內置了安全性。以及創建了新的安全系統，為語音輸出提供防護。

根據對網絡安全、CBRN、説服力和模型自主性的評估表明，GPT-4o 在這些類別中的任何類別中的得分都不高於中等風險，而且團隊繼續降低發現的新風險。

如果要找到 ChatGPT-4o 這些特徵為我們傳遞出來的信息的話，説到底，就是為了讓更多的用户可以更加快速、更加安全、更加高效地使用 ChatGPT-4o。

簡單來講，OpenAI 在 ChatGPT-4o 上的這些進化，正是為了其產品更好地進行商業化。

透過這一點，我們同樣可以看出，AI 的發展，正走在互聯網的道路上。

我們都知道，在互聯網時代，我們經歷了 DOS 系統，Windows 系統以及後來的 iOS 系統、安卓系統等操作系統。

如果對這些操作系統進行總結和定義的話，説到底，它們進行不斷地升級的一個終極目的，就是為了讓互聯網可以更好地商業化，可以讓互聯網更好地與商業場景結合在一起。

當互聯網有了這樣的進化，我們才看到了衍生於互聯網的門户網站、「互聯網 +」應用以及移動互聯網時代所誕生出來的各式各樣的應用。

可以説，互聯網的不斷的迭代和升級所帶來的一個最為直接的結果，便是互聯網的商業化的普及。

對於 AI 來講，其實，同樣是在遵循這樣一種發展脈絡。

説到底，AI 最終還會要落腳在商業化上，才能夠真正將自身的發展潛能釋放到最大。

否則，所謂的 AI，依然僅僅只是一個講給資本市場聽的美好的故事，當資本的熱情不再，特別是當 AI 的發展真正需要自我造血的時候，它的發展，依然還是會面臨這樣那樣的問題。

無論是百度的李彥宏，還是 360 的周鴻禕，乃至是金沙江創投的朱嘯虎，其實都在不同的場合表達過對於 AI 的這樣一種看法。

説到底，他們所表達的觀點，其實都是一箇中心思想。

這樣一箇中心思想，其實就是讓 AI 更多地聚焦場景和應用，更多聚焦在商業化上，而不僅僅只是一個停留在實驗室裏，並不僅僅只是侷限於有限場景之中的小眾存在。

透過 ChatGPT-4o 的發佈，我們可以看出，OpenAI 在探索和實踐商業化的方式和方法，以此為開端，我們將會看到更多有關 AI 沿着互聯網的道路發展的新跡象的出現。

三

回顧互聯網的發展，不難看出，互聯網之所以會獲得如此大的發展，之所以會成為人們的一種生活方式，其中一個很重要的原因在於，互聯網得到了最大限度的普及。

時至今日，互聯網，業已成為了幾乎所有人的生活方式。

以直播、短視頻為主導的全新時代的來臨，更是將互聯網的普及率，帶入到了一個全新的高度。

對於 AI 來講，欲要獲得新的發展，欲要成為一種全新的生活方式，必然需要重新演繹以往互聯網所走過的道路，必然讓以往互聯網所做的普及的動作，重新在自己的身上得到演繹。

如果我們要尋找 OpenAI 這樣一場發佈會提供給我們的新啓示的話，它不斷地讓 AI 進行普及，不斷地將 AI 成為一個被 B 端和 C 端都能夠接受的存在，或許才是值得關注的另外一個方面。

當 OpenAI 以 ChatGPT 的聊天機器人出現在人們的面前，它僅僅只是在聊天這樣一個場景下存在，它僅僅只是解決的是較為簡單的邏輯推理的能力。

時至今日，ChatGPT 早已不再是簡單意義上的聊天機器人，它不僅可以聊天對話、文生圖片，還能文生視頻，甚至還可以像人的反應速度一樣與人們進行交互。

OpenAI 表示，GPT-4o（“o” 代表 “omni”）是邁向更自然的人機交互的一步——它接受文本、音頻和圖像的任意組合作為輸入，並生成文本、音頻和圖像的任意組合輸出。

GPT-4o 可以在短至 232 毫秒的時間內響應音頻輸入，平均為 320 毫秒，與人類的響應時間相似。

它在英語文本和代碼上的性能與 GPT-4 Turbo 的性能相匹配，在非英語文本上的性能顯着提高，同時 API 的速度也更快，成本降低了 50%。與現有模型相比，GPT-4o 在視覺和音頻理解方面尤其出色。

説到底，OpenAI 其實就是通過不斷地提升 ChatGPT 的交互能力來提升人與 AI 溝通和交流的門檻，不斷地讓 OpenAI 的產品更好地進行普及。

如果將 OpenAI 在交互上的提升與互聯網以往的發展脈絡進行總結和定義的話，它們共同的終極目的，其實就是為了讓 AI 可以更好地普及，並且真正讓 AI 成為一種全新的生活方式。

因此，如果我們要找到 OpenAI 的發佈會給我們的新啓示的話，不斷地讓 AI 普及，不斷地沿着互聯網的方向前進，無疑是另外一個最值得我們關注的方面。

正如 OpenAI CEO 奧特曼在發佈會後的博客裏所説的那樣：

「我為我們能在 ChatGPT 中免費提供世界上最先進的模型感到非常自豪，這一切都沒有廣告或其他干擾。最初，OpenAI 的設想是開發 AI 技術，並利用它為全球帶來益處。然而，現實是我們開發了 AI 技術，而其他人則利用這些技術創造了令全世界受益的傑出成果。作為一家企業，我們有很多服務是需要收費的，但不妨礙我們支持向全球數十億用户提供免費的頂尖 AI 服務。」

「新推出的語音（及視頻）模式是我使用過的最佳計算界面。它給人一種電影中 AI 的感覺，讓人不禁驚歎這竟是真的。達到與人類相似的響應速度和表達能力，標誌着一個重大的轉變。最初的 ChatGPT 已經展示了語言界面的潛力；而這一新技術則在體驗上有了質的飛躍。它反應迅速、智能、有趣、自然且實用。以前，我與計算機對話從未感覺如此自然；但現在，我終於有了這種感覺。隨着我們逐步增加個性化選項、獲取個人信息的權限、代表用户執行操作的能力等功能，我真的可以預見到一個激動人心的未來：我們能夠利用計算機完成以往無法想象的更多事務。」

結語

如果一定要尋找 OpenAI 這樣一場短短 26 分鐘的發佈會傳遞出來的信息的話，OpenAI 正走在互聯網的道路上，無疑是再清晰不過的了。

可以説，通過這樣一場發佈會，OpenAI 完成了從 AI 佈道者向實踐者的完美轉身。

對於 AI 來講，其實是需要這樣一場免費化、普適化和商業化的。

至此，OpenAI 開始 open AI。

原因在於，只有經歷了這樣一場普及和商業化，AI 的發展，才不僅僅只是一個停留在實驗室裏的存在，才不僅僅只是一個小眾化的存在，而是成為了一個類似互聯網的，可以與萬千場景，千行百業都實現了深度融合的存在。

以此為開端，ChatGPT 才能真正成為英偉達 CEO 黃仁勳口中的「iPhone 時刻」，而 GPT-4o，無疑是 OpenAI 的奇點時刻。

—完—

作者：孟永輝，資深撰稿人，專欄作家，行業觀察家，知名 KOL，數字經濟學者。