产业深观
2024.05.15 01:14

OpenAI 的奇點時刻

portai
我是 PortAI,我可以總結文章信息。

當 OpenAI 首席技術官米拉·穆拉提發佈桌面版本的 ChatGPT 和新的旗艦模型—GPT-4o,OpenAI 的發展,進入到了一個真正意義上的奇點時刻。

OpenAI 的短短 26 分鐘的發佈會,卻依然引發了不少波瀾。

無論是 ChatGPT-4o 的完全免費,抑或是推出 PC 桌面版的 ChatGPT,無一不為我們顯示出 OpenAI 的領先。

然而,如果僅僅只是一味地尬吹 OpenAI 的領先,必然是沒有太多裨益的。

原因在於,OpenAI 的確在很多方面具備着相對領先的優勢,這樣一種領先,並不僅僅只是體現在它與谷歌的差距上,同樣還體現在它與中國 AI 玩家們的差距上。

透過 OpenAI 的發佈會,我們需要更多地看到的是,時下的 AI 行業,正在發生着的深刻變化,並由此來找到適合當下發展趨勢的新機會。

如果一定要找到 OpenAI 的這場短短髮佈會帶給我們的啓示的話,我更加願意將其看成是 AI 正走在互聯網道路上的一種直接體現。

以此為開端,AI 將會真正從一個侷限於實驗室裏的存在,成為一個被越來越多的大眾所認識、所使用、所接受的存在。

如果我們將 ChatGPT-4o 之前的 OpenAI,看成是一個佈道者的話,那麼,ChatGPT-4o 之後的 OpenAI,則更像是一個實踐者。

一句話,OpenAI 正在 open AI。

未來,我們將會看到越來越多的場景和行業當中,開始出現 AI 的影子,我們將會看到越來越多的玩家們,開始加入到普及與落地 AI 的過程當中。

認識到這一點,我們或許才能更好地把握 OpenAI 這樣一個短短 26 分鐘的發佈會,帶給我們的更深層次的意義。

OpenAI 這樣一個發佈會扔出的「王炸」,其實就是推出了 ChatGPT-4o 這樣一個完全免費的應用。

從表面上來看,OpenAI 之所以會進行完全免費,其中一個很重要的原因在於,它的用户的增長業已進入到瓶頸期,為了拓展更多的用户,OpenAI 便開始通過免費的方式來獲得新的用户。

自去年 ChatGPT 推出後,在 2023 年 5 月達到流量峯值,網絡訪問量達到 18 億次,但之後流量出現下滑情況。2024 年 3 月,ChatGPT 的訪問量依然穩定在了 18 億次,不再有明顯增長。

當 OpenAI 通過 ChatGPT-4o 完全免費進一步降低使用門檻,首先起到立竿見影效果的,便是用户量的增長。

對於業已陷入到用户增長瓶頸期的 OpenAI 來講,無疑是一個非常不錯的嘗試。

如果我們將 ChatGPT-4o 的完全免費,看成是 OpenAI 為了提升用户量所做的一次嘗試的話,那麼,ChatGPT-4o 此次將更多的場景應用到端側模式以及代碼生成能力的場景應用,則是將 OpenAI 的用户量的增長拓展到了更為廣闊的領域之中。

這其實是和互聯網行業的發展,有着異曲同工之處的。

我們都知道,早在互聯網尚未風靡的時候,人們對於互聯網的使用,並不是像現在這樣普及,甚至在很多情況下,人們對於互聯網的使用,如同現在人們對於 AI 的使用一樣,必須要付費。

很顯然,通過付費的方式,很難讓互聯網釋放出更大的發展潛能,很難成就一個叫做「互聯網」的時代的。

於是,為了讓互聯網釋放出更大的發展潛能,為了讓互聯網真正成就一個時代,必然需要做的,便是將以往收費的互聯網服務進行免費,並且真正用這樣一種方式來實現互聯網的最大限度的普及。在此基礎上,我們再去尋找「互聯網 +」的商業模式。

可以説,免費,真正讓互聯網成為了一種「基礎設施」,而免費同樣促進了「互聯網 +」模式的不斷成熟和完善。

對標到 AI 的身上,其實同樣如此。

毋庸置疑的是,OpenAI 通過 ChatGPT 讓我們看到了 AI 的強大,讓我們看到了對於效率提升的積極影響。

然而,在很多時候,人們對於 AI 的感知依然是在收費的情況下完成的,依然是受到收費的掣肘的。

在這樣一種情況下,AI 很難成為一種基礎設施,更加難以釋放出新的更大的發展潛能的。

因此,如果一定要找到 AI 走在互聯網上道路上的具體表現的話,完全免費,並以此來促成 AI 最大限度的普及,並以此來孕育出更多新的商業模式,無疑是最直接的表現。

當 OpenAI 撕開了免費的口子,我們或許還將會在未來看到更多玩家加入其中,從而真正將人們帶入到人人皆可使用 AI,萬物皆可 AI 的全新發展階段。

除了 ChatGPT-4o 的完全免費之外,OpenAI 在發佈會上更多地為我們展示的是,GPT-4o 的模型能力、基準測試、模型安全性和侷限性。

模型能力上,在 GPT-4o 之前,ChatGPT 語音模式對話的平均延遲為 2.8 秒 (GPT-3.5) 和 5.4 秒 (GPT-4)。

如今藉助 GPT-4o,OpenAI 跨文本、視覺和音頻端到端地訓練了一個新模型,這意味着所有輸入和輸出都由同一神經網絡處理。

傳統基準測試層面上,GPT-4o 在文本、推理和編碼智能方面實現了 GPT-4 Turbo 級別的性能,同時在多語言、音頻和視覺功能上均處於高位。

在 5 次 MMLU(常識問題)上,GPT-4o 創下了 87.2% 的新高分,遠超谷歌 Gemini Pro 1.5、Ultra 1.0,以及自己的 GPT-4T 和 GPT-4 等。

模型安全性和侷限性上,GPT-4o 通過過濾訓練數據和通過訓練後細化模型行為等技術,在跨模式設計中內置了安全性。以及創建了新的安全系統,為語音輸出提供防護。

根據對網絡安全、CBRN、説服力和模型自主性的評估表明,GPT-4o 在這些類別中的任何類別中的得分都不高於中等風險,而且團隊繼續降低發現的新風險。

如果要找到 ChatGPT-4o 這些特徵為我們傳遞出來的信息的話,説到底,就是為了讓更多的用户可以更加快速、更加安全、更加高效地使用 ChatGPT-4o。

簡單來講,OpenAI 在 ChatGPT-4o 上的這些進化,正是為了其產品更好地進行商業化。

透過這一點,我們同樣可以看出,AI 的發展,正走在互聯網的道路上。

我們都知道,在互聯網時代,我們經歷了 DOS 系統,Windows 系統以及後來的 iOS 系統、安卓系統等操作系統。

如果對這些操作系統進行總結和定義的話,説到底,它們進行不斷地升級的一個終極目的,就是為了讓互聯網可以更好地商業化,可以讓互聯網更好地與商業場景結合在一起。

當互聯網有了這樣的進化,我們才看到了衍生於互聯網的門户網站、「互聯網 +」應用以及移動互聯網時代所誕生出來的各式各樣的應用。

可以説,互聯網的不斷的迭代和升級所帶來的一個最為直接的結果,便是互聯網的商業化的普及。

對於 AI 來講,其實,同樣是在遵循這樣一種發展脈絡。

説到底,AI 最終還會要落腳在商業化上,才能夠真正將自身的發展潛能釋放到最大。

否則,所謂的 AI,依然僅僅只是一個講給資本市場聽的美好的故事,當資本的熱情不再,特別是當 AI 的發展真正需要自我造血的時候,它的發展,依然還是會面臨這樣那樣的問題。

無論是百度的李彥宏,還是 360 的周鴻禕,乃至是金沙江創投的朱嘯虎,其實都在不同的場合表達過對於 AI 的這樣一種看法。

説到底,他們所表達的觀點,其實都是一箇中心思想。

這樣一箇中心思想,其實就是讓 AI 更多地聚焦場景和應用,更多聚焦在商業化上,而不僅僅只是一個停留在實驗室裏,並不僅僅只是侷限於有限場景之中的小眾存在。

透過 ChatGPT-4o 的發佈,我們可以看出,OpenAI 在探索和實踐商業化的方式和方法,以此為開端,我們將會看到更多有關 AI 沿着互聯網的道路發展的新跡象的出現。

回顧互聯網的發展,不難看出,互聯網之所以會獲得如此大的發展,之所以會成為人們的一種生活方式,其中一個很重要的原因在於,互聯網得到了最大限度的普及。

時至今日,互聯網,業已成為了幾乎所有人的生活方式。

以直播、短視頻為主導的全新時代的來臨,更是將互聯網的普及率,帶入到了一個全新的高度。

對於 AI 來講,欲要獲得新的發展,欲要成為一種全新的生活方式,必然需要重新演繹以往互聯網所走過的道路,必然讓以往互聯網所做的普及的動作,重新在自己的身上得到演繹。

如果我們要尋找 OpenAI 這樣一場發佈會提供給我們的新啓示的話,它不斷地讓 AI 進行普及,不斷地將 AI 成為一個被 B 端和 C 端都能夠接受的存在,或許才是值得關注的另外一個方面。

當 OpenAI 以 ChatGPT 的聊天機器人出現在人們的面前,它僅僅只是在聊天這樣一個場景下存在,它僅僅只是解決的是較為簡單的邏輯推理的能力。

時至今日,ChatGPT 早已不再是簡單意義上的聊天機器人,它不僅可以聊天對話、文生圖片,還能文生視頻,甚至還可以像人的反應速度一樣與人們進行交互。

OpenAI 表示,GPT-4o(“o” 代表 “omni”)是邁向更自然的人機交互的一步——它接受文本、音頻和圖像的任意組合作為輸入,並生成文本、音頻和圖像的任意組合輸出。

GPT-4o 可以在短至 232 毫秒的時間內響應音頻輸入,平均為 320 毫秒,與人類的響應時間相似。

它在英語文本和代碼上的性能與 GPT-4 Turbo 的性能相匹配,在非英語文本上的性能顯着提高,同時 API 的速度也更快,成本降低了 50%。與現有模型相比,GPT-4o 在視覺和音頻理解方面尤其出色。

説到底,OpenAI 其實就是通過不斷地提升 ChatGPT 的交互能力來提升人與 AI 溝通和交流的門檻,不斷地讓 OpenAI 的產品更好地進行普及。

如果將 OpenAI 在交互上的提升與互聯網以往的發展脈絡進行總結和定義的話,它們共同的終極目的,其實就是為了讓 AI 可以更好地普及,並且真正讓 AI 成為一種全新的生活方式。

因此,如果我們要找到 OpenAI 的發佈會給我們的新啓示的話,不斷地讓 AI 普及,不斷地沿着互聯網的方向前進,無疑是另外一個最值得我們關注的方面。

正如 OpenAI CEO 奧特曼在發佈會後的博客裏所説的那樣:

「我為我們能在 ChatGPT 中免費提供世界上最先進的模型感到非常自豪,這一切都沒有廣告或其他干擾。最初,OpenAI 的設想是開發 AI 技術,並利用它為全球帶來益處。然而,現實是我們開發了 AI 技術,而其他人則利用這些技術創造了令全世界受益的傑出成果。作為一家企業,我們有很多服務是需要收費的,但不妨礙我們支持向全球數十億用户提供免費的頂尖 AI 服務。」

「新推出的語音(及視頻)模式是我使用過的最佳計算界面。它給人一種電影中 AI 的感覺,讓人不禁驚歎這竟是真的。達到與人類相似的響應速度和表達能力,標誌着一個重大的轉變。最初的 ChatGPT 已經展示了語言界面的潛力;而這一新技術則在體驗上有了質的飛躍。它反應迅速、智能、有趣、自然且實用。以前,我與計算機對話從未感覺如此自然;但現在,我終於有了這種感覺。隨着我們逐步增加個性化選項、獲取個人信息的權限、代表用户執行操作的能力等功能,我真的可以預見到一個激動人心的未來:我們能夠利用計算機完成以往無法想象的更多事務。」

結語

如果一定要尋找 OpenAI 這樣一場短短 26 分鐘的發佈會傳遞出來的信息的話,OpenAI 正走在互聯網的道路上,無疑是再清晰不過的了。

可以説,通過這樣一場發佈會,OpenAI 完成了從 AI 佈道者向實踐者的完美轉身。

對於 AI 來講,其實是需要這樣一場免費化、普適化和商業化的。

至此,OpenAI 開始 open AI。

原因在於,只有經歷了這樣一場普及和商業化,AI 的發展,才不僅僅只是一個停留在實驗室裏的存在,才不僅僅只是一個小眾化的存在,而是成為了一個類似互聯網的,可以與萬千場景,千行百業都實現了深度融合的存在。

以此為開端,ChatGPT 才能真正成為英偉達 CEO 黃仁勳口中的「iPhone 時刻」,而 GPT-4o,無疑是 OpenAI 的奇點時刻。

—完—

作者:孟永輝,資深撰稿人,專欄作家,行業觀察家,知名 KOL,數字經濟學者。

本文版權歸屬原作者/機構所有。

當前內容僅代表作者觀點,與本平台立場無關。內容僅供投資者參考,亦不構成任何投資建議。如對本平台提供的內容服務有任何疑問或建議,請聯絡我們。