近幾天,科技圈最大的新聞莫過於 OpenAI 和谷歌這兩場發佈會。 24 小時之內,OpenAI、谷歌這兩家 AI 巨頭相繼亮劍。 5 月 14 日,OpenAI CEO Sam Altman 親自下場造勢,在 20 多分鐘的發佈會中,用全新的多模態模型 GPT-4o 喚醒了人們對電影《Her》中人工智能系統 “薩曼莎” 的幻想。 次日,谷歌宣佈升級 Gemini,推出 “AI 全家桶”,推出集成 AI 的搜索引擎,用 AI 重塑 Android。它試圖藉此重振旗鼓,搶回 AI 賽道上的主動權。過去一年多里,OpenAI 多次截胡谷歌,搶在谷歌之前發佈新技術、產品。 無論是雙方在技術上的比拼,還是 OpenAI 牽手蘋果,都表明,OpenAI 這家 AI 屆的當紅明星都對谷歌造成了前所未有威脅。 當然,手握搜索入口、安卓生態王牌的谷歌的護城河在短期內難以攻破。然而在顛覆產業格局的 AI 時代裏,面對後浪的追趕,谷歌等科技巨頭不能鬆懈,否者,便是一個時代的遠去。 交戰 儘管被 OpenAI 搶佔了先機,但谷歌顯然是有備而來。 OpenAI 推出能説會道的 GPT-4o,谷歌也有自己的薩曼莎——Project Astra。 “我腦海中已經有這個願景很長一段時間了。” 谷歌 DeepMind 的負責人、谷歌人工智能工作負責人 Demis Hassabis 説。這些年,他一直在思考和研究人工智能,思考如何讓機器更像人。 在他的設想中,一個人工智能 Agent 必須能像人一樣理解並對複雜靈活的世界做出反饋。它要能看到文本並且有所反應,並且必須有主動性、可被教育的而且有個性,所以能自然地,沒有延遲地和它交談。最終,這些所有的想象就成了 Project Astra。“就是那個幫手,” Hassabis 説,“它很有用,你已經習慣它在你需要的時候一直在那裏。” 從演示視頻來看,Project Astra 與 Hassabis 的設想顯然還有距離。甚至與 GPT-4o 相比,延遲也更高,交流仍然不夠自然。但當 Project Astra 準確説出 “眼鏡在書桌上,紅色蘋果旁邊” 時,還是獲得了在場觀眾的驚呼聲。 Project Astra 的出現,也被視作是對 GPT-4o 的正面回應。 這並非是 OpenAI 和谷歌的第一次正面交戰。今年 2 月,在谷歌發佈會一週後,OpenAI 悄無聲息拋出重磅炸彈,推出了首款文本轉視頻模型——Sora。儘管 Sora 至今未曾開放使用,仍然給整個科技圈帶來了震撼。 對於 OpenAI 扔下的這顆炸彈,谷歌同樣在開發者大會上給出反擊,發佈了 AI 媒體創作模型 Veo。據介紹,Veo 能夠生成高質量的 1080p 視頻,並且依託於 Imagen 3 這一最新的文本到圖像框架。這些 AI 生成的視頻可以持續超過一分鐘,Veo 還能夠理解電影製作和視覺技術的專業概念,如延時拍攝等。 不僅如此,谷歌將 Gemini 集成到了旗下幾乎所有產品之中,尤其是其優勢業務——搜索,將搜索能力變得更為強大。 儘管兩場發佈會,一個僅有 20 多分鐘,一個長達 2 小時,對兩家公司而言,卻是一次技術上的巔峯對決。 焦慮 兩大 AI 巨頭貼身肉搏背後,是 AI 廠商的商業化焦慮。 2015 年,名不見經傳的 OpenAI 在硅谷成立。彼時,它還是一家非營利機構。依靠着微軟的 10 億美元投資,過着掃地僧的生活。 自 2022 年 11 月,ChatGPT 問世後,OpenAI 一炮打響,商業化進程也不斷加速。2024 年 4 月,OpenAI 的 COO 稱,目前企業版 ChatGPT 的註冊用户超過 60 萬,而今年 1 月這一數字為 15 萬多。 受惠於企業對 AI 技術的需求,消息稱,OpenAI2023 年年收入已過 20 億美元。 在這場由 ChatGPT 引發的 AI 熱浪下,國內外科技大廠紛紛坐上牌桌。 2023 年 2 月 6 日,谷歌宣佈推出對話式生成人工智能聊天機器人 Bard,這是谷歌旗下大模型 Gemini 的前身;Meta 則官宣發佈 Llama;同年 3 月,美國公司 Anthropic 推出 Claude;國內公司也立馬跟上,百度發佈文心一言,阿里推出通義千問,華為旗下則是盤古,商湯也上新日日新。 科技大廠紛至沓來,OpenAI 想要走通商業化之路,搶佔先機,就必須保證其技術上的領先,不斷推出新的更強大的模型。不過,目前看來,這一路徑變得更加艱難。 經過一年多的發展,各廠商相繼推出了對標 GPT-4 的大模型。 更具挑戰的是,OpenAI 迭代的速度開始變慢了。從第一代 ChatGPT 到 ChatGPT 的發佈,OpenAI 只用了 4 個多月。但距離 ChatGPT-4 發佈已經過去 1 年多,眾人期待的 ChatGPT-5 仍未現身。GPT-4o 的確令人印象深刻,但還不足以給整個行業帶來足夠的驚豔。 當然,OpenAI 變慢,主要受制於大模型迭代的客觀規律。越大越強的模型,數據和算力需求就更高。最終,這些都轉化成 OpenAI 的成本壓力。 相比於 OpenAI 龐大的研發成本,超 20 億美元的年收入依舊是杯水車薪。Sam Altman 表示,由於構建和運行其模型的成本高昂,OpenAI 仍然處於虧損狀態。隨着 OpenAI 開發更復雜的模型,預計支出將繼續超過收入增長。OpenAI 可能還需要籌集數百億美元才能滿足這些成本。 除了外部競爭,OpenAI 還要面臨 “內憂”。5 月 15 日,自去年年底 “宮鬥” 事件之後就未曾露面的 Ilya Sutskever 官宣離開,表示自己已經有了下一個計劃,但目前還不能透露細節。 作為 OpenAI 的聯合創始人和首席科學家,Ilya Sutskever 主導了 GPT 系列大模型以及 DALLE 系列模型的研發。儘管不曾出席 GPT-4o 的發佈會,但在 GPT-4o 主頁上,Ilya 的名字出現在 “額外領導者” 一欄。Ilya Sutskever 的離開,對 OpenAI 商業化的影響,仍然難以判斷。 追趕 當技術之間的差距逐漸縮小,AI 廠商之間的競爭也步入下半場。 在兩場發佈會上,OpenAI 和谷歌默契地開始關注端側。GPT-4o 推出 Mac 版本應用,谷歌則用 Gemini 重塑 Android。 中國銀河證券分析認為,GPT-4o 發佈預示着 AI Agent 新一輪競爭序幕即將拉開,疊加 macOS 桌面版 ChatGPT 集成,端側 AI 革命在即,此外 B 端企業服務市場可能會因為 GPT-4o 的易用性和普惠性而迎來新的增長機遇。 新的商機下,誰能搶得先機,佔領更多終端,誰就能先行佔有市場。 在這方面,谷歌擁有天然的優勢。谷歌旗下擁有谷歌搜索、Gmail、Youtube、Chrome 瀏覽器等一系列應用,構建了強大的生態。 相較之下,作為第一個推出大模型的公司,儘管 OpenAI 在 AI 紅利之下,創下了一系列記錄。其用户體量和谷歌相比,仍然有着不小差距。 Similarweb 統計數據顯示,ChatGPT 今年 4 月全球訪問量為 18 億次,相比 3 月有所上升。與此同時,儘管谷歌 4 月的訪問量相比 3 月有所減少,但仍達到了 834.9 億次。 更不用説,谷歌還擁有 Android。在今年開發者大會上,谷歌對 Android Studio 進行了升級,集成了更多 AI 功能,方便開發者調用 Gemini API 進行軟件開發。 英偉達人工智能工作室負責人 Jim Fan 表示,谷歌做對了一件事,他們終於努力將人工智能整合到搜索框中。在他看來,分發是谷歌的護城河。在這一背景之下,Gemini 不一定要做世界上最好的模型,就可以成為世界上使用量最多的模型。 在 OpenAI 和谷歌的這場戰爭中,谷歌擁有 Android 等一系列產品,而 OpenAI 缺一個蘋果。 作為 2023 年手機出貨量一哥,去年一年裏,iPhone 出貨量達到了 2.346 億台,市場份額為 20.1%。如果 OpenAI 旗下大模型真能取代 “Siri”,成為搭載在數億蘋果設備上的 AI 智能助手,在搜索體驗、效率提升上顛覆現有生態,對於 OpenAI 而言,或許一切將變得不同。