作者 | 範昕茹 編輯 | 周智宇 端側模型成了科技巨頭的兵家必爭之地,繼在谷歌、三星和微軟後,蘋果也加入了戰局。 4 月 25 日凌晨,蘋果發佈了 OpenELM。這是一個全新的開源語言模型(LLM)系列,可以完全在本地設備上運行,無需連接雲服務器。 過去蘋果生態相對封閉,如今它也以一個開放的姿態,加入大模型的開源浪潮當中,希望藉此追上 AI 熱潮。 也許在 6 月的全球開發者大會 (WWDC 2024),外界就能夠窺得蘋果如何通過 OpenELM 在 AI 技術上創新,並將其搭載到 iPhone 等設備上,提升效率。 這也會是蘋果在備受投資者詬病多年,認為其在 AI、大模型上顯得 “慢一拍” 後的翻身之戰。憑藉蘋果自身擁有的芯片資源、軟硬件一體化的生態系統,看似 “慢一拍” 的蘋果或許也將擁有彎道超車的機會。 圍困 在今年 2 月的投資者電話會議中,Tim Cook 這樣解釋蘋果在人工智能領域的 “慢一拍”。 “我們的模式,一直是先做工作,然後談論工作,而不是搶先一步。” 會上,Tim Cook 透露,蘋果內部正在進行大量 AI 方面的工作,並將在今年晚些時候對此進行討論。 不過,還沒等到 “今年晚些時候”,蘋果便發佈了自己的開源語言模型 OpenELM。 OpenELM 是一系列開源語言模型,分為指令微調和預訓練兩種模型,有 0.27B、0.45B、1.08B、3.04B 四種參數,提供生成文本、代碼、翻譯、總結摘要等功能。 相比目前大多數 8B 左右的模型,其對芯片的要求也更低一些。但在大模型能力上,蘋果表示,與 1.2B 參數的 OLMo 模型相比,1.1B 參數的 OpenELM 準確率高出 2.36%,但預訓練需要的 token 數量卻只有 OLMo 的一半。 相比此前蘋果已經公佈的 MM1 多模態大語言模型,此次發佈的 OpenELM 不僅體量更小,其最受人關注的一點在於,這系列語言模型無需接入雲端,即可在端側完成推理和微調,是一款專門針對手機等移動設備開發的端側大模型。 所謂端側大模型,通常指的是在終端設備上(如手機、平板電腦、智能音箱等)部署和運行的大模型。和 ChatGPT 等大模型不同,這類大模型可以在終端設備上完成推理任務,進行微調,而不受網絡的限制。 其實,幾乎在大模型成為科技圈流行詞的時候,如何將大模型落地端側,尤其是和人們日常生活息息相關的手機上的討論就層出不窮。然而,受制於大模型的體量以及芯片性能、能耗等因素,汽車曾被視為是最可能最先運行端側模型的終端。 不過,經過一年多的探索,隨着大模型性能的不斷提升,參數更少、性能更強的大模型開始出現,給了模型落地端側的可能,也讓搭載端側模型的 AI Phone 成為各家科技廠商追逐的重心。 如今,市面上主流手機廠商幾乎都已經推出了自家的端側大模型。例如 OPPO 的 AndesGPT,vivo 的藍心大模型,小米方面則有大模型 MiLM,三星也推出 Galaxy AI。 最近一段時間,各大科技廠商更是密集發佈了一波端側大模型。 就在 OpenELM 發佈前 2 天,4 月 23 日,微軟在其官網開源了可以在端側部署的小語言模型 Phi-3-mini。更早之前,Meta 發佈了其最新開源模型 Llama3,提供 8B 和 70B 的預訓練和指令微調版本。隨後,高通宣佈和 Meta 合作,優化 Llama3 在手機、PC 等端側設備的表現。而在國內,商湯剛剛發佈了 1.8B 的 SenseChat-Lite 版本端側大模型。 這一次,蘋果似乎又姍姍來遲。 突圍 近幾年,蘋果已經很少能夠推出顛覆性的產品,在所有產品線中,iPhone 成為蘋果營收的最大功臣。蘋果公佈的 2024 年第一財季數據顯示,蘋果 2023 年第四季度的營收為 1196 億美元,同比增長 2%;利潤 403 億美元,同比增長 12%。其中,iPhone 貢獻了 697 億美元,佔比超過了 58%。 但近年來,iPhone 的銷售也備受挑戰。4 月 25 日,國際數據公司(IDC)發佈的最新手機季度跟蹤報告顯示,2024 年第一季度,中國智能手機市場整體出貨量約 6926 萬台,同比增長 6.5%,市場表現高於預期。與此同時,iPhone 在華銷售同比下降 6.6%,市場佔有率也隨之降至 15.6%,和 15.7% 的 OPPO 並列第三。榮耀和華為的出貨量則並列前二。 IDC 中國區副總裁王吉平認為,此次榮耀登頂,AI 成為關鍵增長引擎。得益於 AI 功能,榮耀全新旗艦 Magic6 系列首銷第一季度出貨量超過上一代產品前二季度出貨量之和。 在各家手機廠商紛紛進入 AI 手機時代,處於壓力之下的蘋果,也急需加入大模型的戰爭來贏得市場信心。 不過,蘋果還有機會。 如今,對一些手機廠商來説,單純把大模型 “塞” 進手機似乎已經不是最大的難題,問題在於如何利用大模型給到用户一個差異化、個性化甚至顛覆性的體驗。這不僅考驗端側大模型的能力,手機芯片的性能和能耗控制,還需要大模型和手機軟硬件系統的深度融合,滲透到手機應用的方方面面。 在這一點上,選擇自研芯片,從一開始就強調軟硬件一體化,有着完整開發生態的蘋果顯然佔據優勢。 目前,無論是國內還是國際大廠,關於 AI 手機的探索大多采取的是大模型廠商、芯片廠商和手機廠商三方合作的方式進行。例如,Meta 選擇與高通合作,探索 Llama3 8B、70B 大模型落地端側的可能。更早之前,阿里雲旗下大模型通義千問想要適配手機端則需要聯手聯發科。而大多數手機廠商都沒有自研芯片,需要依賴芯片廠商的供給。這就意味着額外的定製成本及適配、優化成本。 同時擁有自研芯片、大模型以及軟硬件生態的蘋果可以省去其中的許多麻煩。 例如,OpenELM 的基準測試就是在蘋果設備上完成的。官方論文顯示,OpenELM 的基準測試使用的是配備 M2 Max 芯片,64GB 內存,運行 macOS 14.4.1 版本的 Macbook Pro。不僅如此,蘋果還發布了將模型轉換為 MLX 庫的代碼,以便技術人員在 Apple 設備上對大模型進行推理和微調。 這意味着,OpenELM 可以順暢地融入蘋果整個生態圈,打通芯片、手機硬件和軟件層的隔閡,更好地對大模型進行系統層面的適配和優化。這是其他手機廠商所不具備的優勢。 軟硬件一體的策略曾使 iPhone 在手機行業中保持了多年的領先。近年來,蘋果在自研芯片、軟硬件生態一體化上的堅持,或許將幫助蘋果在大模型時代獲得一個彎道超車的機會。從 iPhone 到 AI Phone,看起來已經不遠。