AI 界的 “科技春晚”、OpenAI 開發者大會,到底有多令人興奮? 11 月 7 日,在 OpenAI 開發者大會之後,科技博主 Dan Shipper 發表了一篇有關他在這場大會上見聞的文章,他介紹了 OpenAI 提出的主要更新,並稱 OpenAI 的進步速度驚人,未來幾個月和幾年將 “非常瘋狂”。 Shipper 説,OpenAI 推出的 GPT-4 Turbo 有着五大升級:更大的上下文容量、更高的智能級別、更快的響應速度、更低的價格以及更簡單的操作。它不僅令模型本身得到加強,與模型交互的方式也更簡單、便捷。全新的檢索功能和自動維護對話狀態使開發者可以更容易地構建應用;無代碼自定義 ChatGPT 又降低了普通用户的門檻。 他認為,以上的這些特性為 OpenAI 日後推出代理服務的更新奠定了基礎。所謂代理,即模型可以自主規劃和執行更復雜、多步驟的任務,並且在沒有監督的情況下完成。雖然 GPT-4 現在還沒有 “聰明” 到那個程度,但 OpenAI 已經在為這個目標做準備。 Shipper 還分析了 OpenAI 試圖建立應用商店的戰略。他認為這個戰略可以讓用户建立自己個性化的 GPT 並且據此收費,是一種令構建聊天機器人的能力民主化的表現。但這種戰略同時也存在問題,比如用户可能對於在不同版本的 ChatGPT 之間切換感到疲憊——Shipper 認為這是 OpenAI 需要解決的問題。 最後,他還提到了 OpenAI 與開發者之間的微妙關係。他指出,OpenAI 近來發布的許多更新更多地針對的都是消費者,而非開發者,但 OpenA 最初成立的目標卻是服務開發者。這造成了一種矛盾,即 ChatGPT 會直接與開發者產生競爭。 Shipper 認為,如果 OpenAI 不得不在 ChatGPT 和其開發者生態系統之間做出選擇,它將選擇前者: ChatGPT 是 OpenAI 最有價值的高質量訓練數據來源,所以它是改進模型質量的最佳途徑。 Shipper 補充稱,這實際上是許多科技公司所面臨的核心問題,比如蘋果也因其內部產品與第三方開發者產品競爭而遭到批評,但這個問題對於 OpenAI 來説可能更為嚴峻: 這就像蘋果允許開發者發佈自己版本的 iOS。 但總體而言,Shipper 認為,OpenAI 的這場活動仍然是激動人心的,並且展示了這家公司驚人的進步速度: 現在沒有任何公司比 OpenAI 做的工作更有趣、更快。這家公司的進步速度驚人,在可預見的未來也沒有放慢的跡象。 在這個會議上,業內的説法是,OpenAI 是一個人才強者,給人的感覺非常像鼎盛時期的 Stripe。(事實上,我聽説 OpenAI 聘用了許多曾在 Stripe 工作過的人。) 房間裏的能量是顯而易見的。我認為科技行業中沒有更大、更有趣的故事了。未來的幾個月和幾年將非常瘋狂。 以下為 Shipper 在其創辦的科技資訊網站 Every 上發表的文章原文,由華爾街見聞整理編譯: 我在 OpenAI 開發者日上的見聞 我喜歡觀察人們以為無人注意時的舉止動作。 這就是參加 OpenAI 開發者日等活動的難得之處:你可以看到攝像頭沒有捕捉到的東西,聽到台上沒有説出口的話語。 現場人頭攢動,水泄不通,WiFi 飛快,LED 燈閃閃發亮。這是為 AI 技術迷如我準備的魔術秀。 我在人羣中穿梭,做着我的專利動作 FCO:"偷偷摸摸地窺視會議"(Furtive Conference Ogle)。我會看到某個也許很有名的人——比如説,Roon,或者 Karpathy,或者 Kevin Roose——然後迅速低頭看一眼他們的徽章,在他們給我一個"嘿,我的眼睛在這裏,夥計!"的表情之前又抬起頭來看他們的臉。 我通常喜歡在活動中坐在後排,但在開發者日我確保坐在了前排。我想近距離觀看這場魔術秀。 Sam Altman 走上舞台,向觀眾致意。在他表演時,我可以從他的臉上和身上看到緊繃、內斂、緊張的能量。我能從他的表演中感受到他經過數小時的練習。簡短的開場獨白之後,Sam 介紹了一段視頻,視頻中創意專業人士、開發人員和普通人都在談論他們是如何使用 ChatGPT 的。燈光暗下來,他走到一邊,視頻開始了。大家都在看視頻,我卻在看 Sam。 他獨自站在舞台一角的陰影裏。他穿着深色牛仔褲和原色的阿迪達斯 x 樂高合作款運動鞋。他雙手合十,目不轉睛地盯着地板。Sam 很緊張,總是"繃着"。但在舞台一側,聽着正在播放的視頻,他卻顯得不修邊幅,不學無術。我感覺自己抓住了魔術師操縱一枚隱藏硬幣的左手,而觀眾們卻在看他揮舞的右手。 暫時看穿魔術師的秘密會打破他們的魔力。但它也會創造一種新的魔力:你會將魔術師看作一個人類。吃飯,呼吸,一條腿一條腿地穿褲子,卻仍然施法。 Sam 正在成為科技界的傳奇人物。但在舞台上的那一刻,他也是一個人。他看起來樂在其中,觀察並期待着自己創造的東西,並看着它在世界最大的舞台上上演。他實現了所有曾經制造過某樣東西並希望世界會喜歡它的人的夢想。 目睹他那一刻本身就值回入場券的價格。我不會很快忘記。 以下是他要告訴我們的: 更大、更智能、更快、更便宜、更簡單。 這就是 OpenAI 昨天宣佈的主要變化。讓我們逐一回顧這些更新,並討論它們為何如此重要。 一個新模型:GPT-4 Turbo 更大 OpenAI 推出了一款新模型 GPT-4 Turbo,它擁有 128K 的 Token 上下文窗口。這意味着你發送給 GPT-4 Turbo 的每個提示符可以相當於 300 頁的文本。以下這些東西在 300 頁以內: 埃裏克·萊斯的《精益創業》的全部內容 聖埃克蘇佩裏的《小王子》三本 我中學時喜怒無常的日記的至少一半 這比今天之前最廣泛使用的 GPT-4 版本的上下文窗口長度增加了 16 倍。它顯著增強了開發人員使用 GPT-4 可以運行的查詢的複雜性和功能。以前,開發人員必須花費時間和精力來決定將哪些信息放入他們的提示符中,這是 LLM 性能最重要的瓶頸之一。 128K 的上下文窗口極大地簡化了這一任務,但並未解決所有問題。過長的上下文窗口不易管理,而且語言模型會越來越多地忘記或忽略上下文信息。我們還不知道 GPT-4 Turbo 是否存在這些問題,我會在使用過程中與你分享。 更智能 GPT-4 Turbo 在以下幾方面比 OpenAI 以前的模型更智能: 它可以同時使用多種工具。 之前版本的 GPT-4 引入了工具使用,我有報道過。工具使用允許 GPT-4 調用開發者定義的工具——如網頁瀏覽、計算器或 API——來完成查詢。之前,GPT-4 每次只能使用一個工具。現在它可以同時使用多個工具。 知識截止時間更新。 之前版本的 GPT-4 只知道到 2021 年 9 月之前的事件。這個版本更新到了 2023 年 4 月,使其更加可靠。 GPT-4會 JSON。 JSON 是一種非 AI 應用可以輕鬆讀取的文本格式。GPT-4 Turbo 可以可靠地以這種格式返回結果——使其更易與其他軟件集成。之前,開發者需要通過例如告訴 GPT 如果格式錯誤就會被解僱來 “哄騙” 它正確格式化輸出。不再需要哄騙了。 GPT-4可以編寫和運行代碼。 一段時間以來,ChatGPT Plus 用户可以使用代碼解釋器 (後改名為高級數據分析),這是一個可以為你編寫和運行 Python 代碼的 ChatGPT 插件。它就像一個口袋裏的數據科學家——現在開發者可以通過 GPT-4 API 使用和集成到自己的程序中。 多模態。 GPT-4 API 可以接受圖像作為輸入:開發者可以發送任何圖像,GPT-4 可以告訴他們看到了什麼。它還可以進行文本到語音,這意味着它可以用人聲回覆文本輸入。它還可以用 DALL-E 進行圖像生成。 更快 據我所知,目前還沒有公開的速度基準測試,但 Sam 説它更快。根據我昨晚穿着睡衣進行的科學測試,他是對的。它真的很快。它讓 GPT-4 望塵莫及,看起來至少和 GPT 3.5 Turbo 一樣快,甚至略快於 GPT 3.5 Turbo——之前最快的模型。 更便宜 GPT-4 Turbo 比 GPT-4 便宜 3 倍。我不記得有哪家公司能在大幅提升性能的同時還能降低價格。 我們很幸運,OpenAI 採用的是硅谷的遊戲規則,旨在創造大規模應用,而不僅僅是高額的企業合同。只要足夠便宜,人工智能就能為每個人所用,而這正是 OpenAI 的目標。 如果 IBM 發明了 GPT,你認為它會做這樣的事情嗎?不會。 更簡單 OpenAI 也使開發者和非開發者更容易與 GPT-4 Turbo 交互。該公司使許多第三方庫的功能 (以及開發者通常編寫的模板代碼) 變得不必要。以下是一些方式: 檢索。 這是一個重大進步。提高大型語言模型性能的最重要方式之一是讓模型訪問私人數據,如公司知識庫或個人筆記。以前,這種功能需要手動構建 (就像我為我的 Huberman 實驗室聊天機器人所做的那樣),或使用第三方庫,如 Langchain 或 LlamaIndex(我是後者的投資人)。OpenAI 通過其檢索功能將這些庫的部分功能集成到了其核心 API 中——使開發者更容易開始構建 GPT-4 應用程序。 這會產生有趣的結果。一方面,它減少了對這些第三方庫的需求。另一方面,OpenAI 的檢索機制目前是一個黑箱,沒有可配置性。檢索是一個難題,不同目的有許多不同的檢索機制。OpenAI 的新發布涵蓋了基礎知識,但 Langchain 和 LlamaIndex 實現了各種各樣的檢索類型,並且適用於非 OpenAI 製作的模型——所以它們的服務仍有需求。 保存狀態。 我之前寫過,GPT-4 就像《初戀 50 次》裏的朵琳·芭麗摩:每次和它交互時,你都必須一次又一次地介紹你是誰,為什麼它愛你。GPT-4 API 可以通過一個名為"Threads"(與 Meta 的 Twitter 克隆版無關聯)的新功能自動記住對話歷史,節省開發者的時間和麻煩,因為他們不再需要自己管理對話歷史。 自定義無代碼 ChatGPT。 OpenAI 還使任何人都可以輕鬆構建自己的自定義 ChatGPT 版本,內置私人數據——無需編程。任何人都可以設置一個 ChatGPT 版本,具有自己的個性和訪問私人知識的能力。這是一個重大進展。今年早些時候,我為 Substack 作者 Lenny Rachitsky 構建了一個基於他的新聞稿存檔的機器人。如今的更新意味着任何人都可以構建等效的機器人——無需編碼。 GPT應用商店。 OpenAI 宣佈任何人都可以在公共應用商店中列出自己的 GPT 併為之收費。我主張將聊天機器人作為一種新內容形式已經近一年了——這一發展支持了這一論點。 無需切換模型。 這是一個巨大的更新。在以前版本的 ChatGPT 中,您必須選擇要使用的模型: GPT-3.5、GPT-4、GPT with DALL-E、GPT with Web Browsing 或 GPT with Advanced Data Analysis。現在,您只需要向 ChatGPT 發送一條消息,它就會為您選擇合適的模型。用户可以更輕鬆地將 ChatGPT 的不同功能組合使用,無需來回切換,而且這為開發者創造了新機遇 (本文後面會涵蓋)。 增量更新——為未來奠定基礎 所有這些更新都很棒,但它們大多是增量。它們在 API 中構建了許多開發人員必須自己完成的任務,從而使開發人員構建的東西更快、更便宜、更強大。 不過,這些特性為一個可能更重要的更新奠定了基礎:代理。代理是一種模型,它可以被分配複雜的、多步驟的任務,並在沒有監督的情況下完成這些任務。這就是 GPT-4 的新助手 API。 這是支持檢索、保存狀態和工具使用的 API(如上所述)。這些要素加在一起,就是代理服務的開始。從目前的情況來看,OpenAI 似乎正在預測一個世界,在這個世界中,您將能夠給助手分配一個目標,給他們一組工具,並讓他們自己完成目標。 我們離那還很遠,因為 GPT-4 還不夠聰明,無法自主規劃和執行任務。但 OpenAI 現在正在奠定架構和安全基礎,並有意推出漸進式步驟,以使技術準備就緒。 OpenAI正試圖打造一個應用商店 今年 4 月,OpenAI 推出了插件,允許用户從 ChatGPT 內部訪問第三方服務和數據。有很多關於插件將成為一個新的 App Store 的宣傳,但事實並非如此。OpenAI 從未發佈過相關數據,但據我所知,第三方插件的採用率非常低,儘管 OpenAI 構建的兩個插件:代碼解釋器和 DLL-E 的採用率很高。 現在,OpenAI 憑藉 GPT 再次嘗試這一點——它的服務允許任何人使用私人數據創建 ChatGPT 的定製版本: 任何用户都可以創建 GPT。你可以定義它的個性:它如何回應詢問,使用什麼聲音和語氣。您可以讓它訪問一些工具,比如執行代碼的能力,或者從私有知識庫中獲得問題的答案。然後可以發佈 gpt 供其他用户使用。 我安裝了一個名為 “談判者” 的新 GPT(由 OpenAI 構建),它可以幫助你在任何類型的談判中為自己辯護。它顯示在我的 ChatGPT 側欄如下: 如果我點擊談判者,它將把我從普通的 ChatGPT 中移出,進入一個專門設計的體驗,幫助我在任何談判中獲得最佳結果: 我很喜歡這種方法。我喜歡這個讓構建聊天機器人的能力民主化的想法——我可以預見,在接下來的幾周裏,我將在這裏進行大量的實驗。 儘管如此,我還是有疑問。它面臨着與 OpenAI 失敗的插件實驗相同的問題:沒有人願意為不同的用例在不同版本的 ChatGPT 之間切換。 更好的方法是讓 ChatGPT 能夠在需要時自動切換到特定的個性,比如 “談判專家”,並在不需要時再切換回來。在這發生之前,我看不到這些機器人有太大的採用。 但如果它發生了,那將是巨大的。為 ChatGPT 下載一個新的個性將等同於讓你的 AI 閲讀一本新主題的書或上一門課。在這個世界裏,會有一整個經濟體的人創建的內容是專門針對 LLM 而不是人類。例如,我可能會購買 ChatGPT 閲讀和攝取的談判書等價物,而不是購買一本自己閲讀的談判書。 因此,我認為 OpenAI 最終確實有機會建立一個應用商店體驗。但在他們能夠弄明白如何讓 ChatGPT 在長長的個性列表之間自動切換之前,這是不會發生的。鑑於 OpenAI 改變了 ChatGPT,以便您不必在其內部模型之間切換,這對自定義 GPT 來説也可能很快就會到來。 OpenAI與開發者的關係 這個開發者大會最引人注目的一件事,是 OpenAI 發佈的許多更新更多地是針對消費者而不是開發者。例如,自定義 GPT 是面向消費者的,OpenAI 發佈的一些 ChatGPT 特定更新也是如此。這反映了一件重要的事情:OpenAI 目前處於消費者公司和開發者公司之間。 ChatGPT 生來就是有原罪的。當 OpenAI 剛開始時,其目標是服務開發者——直到它意外地創建了有史以來最大的消費者應用。不幸的是,這使該公司與開發者處於對立面,因為 ChatGPT 直接與開發者想要構建的許多東西競爭——無論是在消費者層面還是基礎設施層面。 如果 OpenAI 不得不在 ChatGPT 和其開發者生態系統之間做出選擇,它將不得不選擇 ChatGPT。ChatGPT 是 OpenAI 最有價值的高質量訓練數據來源,所以它是改進模型質量的最佳途徑。 不僅如此,OpenAI 還正在朝着商品化和消費化開發工作的方向發展。ChatGPT 本身可以把任何人變成一個半熟練的程序員。它昨天推出的功能允許任何人在不需要編碼的情況下構建聊天機器人。 這是該公司核心的一個基本緊張關係。這個緊張關係也是許多平台的核心——例如,蘋果公司面臨着 iOS 和 MacOS 的緊張關係。蘋果因內部產品與第三方開發者產品競爭而遭到批評,這被稱為 “夏洛克”。 但對 OpenAI 來説這更成問題,因為它的消費者產品與它為開發者提供的產品驚人地相似。這就像蘋果允許開發者發佈自己版本的 iOS。 我猜如果你想在 OpenAI 生態系統中發揮作用,最好的方法是收集將對使用 ChatGPT 的某人有用的私人數據集,並將其作為自定義 GPT 發佈。 OpenAI 可能會投資於使 GPT 在 ChatGPT 界面中更易訪問、隨時間更強大。你帶到派對上的優勢將是私人的、經過策劃的數據——以及一套規則,用於説明如何為特定類型的用户在特定情況下運用這些數據。這很可能不是 OpenAI 要直接競爭的東西——所以這是一個雙贏。 全球最激動人心的公司 現在沒有任何公司比 OpenAI 做的工作更有趣、更快。這家公司的進步速度驚人,在可預見的未來也沒有放慢的跡象。在這個會議上,業內的説法是,OpenAI 是一個人才強者,給人的感覺非常像鼎盛時期的 Stripe。(事實上,我聽説 OpenAI 聘用了許多曾在 Stripe 工作過的人。) 房間裏的能量是顯而易見的。我認為科技行業中沒有更大、更有趣的故事了。未來的幾個月和幾年將非常瘋狂。 零碎事項 多樣性。我很欣賞這次會議的包容性。據我所知,這家公司提供的食物非常美味,是由當地女性或少數族裔經營的企業提供的。演示和小組討論的演講者非常多樣化,他們在 OpenAI 和 Shopify 和 Salesforce 等其他大型科技公司擔任領導職務。這一切都很低調,沒有表演。在我看來,OpenAI 做得對,值得讚揚。 OpenAI 和微軟。一位與會者對我説,他認為 OpenAI 與微軟的關係讓他想起了蘋果與英特爾的長期合作關係。處理器是英特爾製造的,其他一切都是蘋果做的。在 OpenAI 的案例中,微軟提供託管基礎設施,而 OpenAI 負責其他所有工作。這不是一個完美的類比,但它引起了我的共鳴,尤其是在薩蒂亞·納德拉 (Satya Nadella) 出現在這次會議上,在 Sam 發表主題演講時與他站在舞台上。 有人能分清 OpenAI 的命名嗎?我簡直不敢相信它將它的新自定義無代碼 ChatGPTs 命名為 “GPTs”。需要有人出面干預——這太令人困惑了。