端側 AI 大模型新賽道最近又迎來兩個重量級玩家——蘋果和華為,這為智能終端(主要是手機)走出低迷狀態提供了新的希望和動力。 Apple GPT 是蘋果公司基於其自研的 Ajax 框架開發的 AI 工具,目前在蘋果公司內部展開小範圍內測;華為則通過在 8 月 4 日下午舉行的 HDC 2023 開發者大會上發佈的 HarmonyOS 4 的智能助手 “小藝”,展示了端側 AI 大模型在應用層面的能力。 此前,Meta、OpenAI、高通、谷歌、騰訊和百度等,已經或即將推出支持端側 AI 大模型的應用或技術框架,正在快速勾勒這個全新方向的技術和市場前景。 HarmonyOS 4:有何端側 AI 大模型能力 8 月 4 日,華為正式發佈 HarmonyOS 4。華為 HarmonyOS 是面向萬物互聯的全場景分佈式操作系統,支持手機、平板、智能穿戴和智慧屏等多種終端設備運行。 在華為這個著名的 IoT 操作系統的第四版中,端側 AI 大模型(即在手機側運行大模型)的能力成為關鍵核心。 “今天我們已進入大模型時代,華為盤古大模型將助力鴻蒙生態。” 華為常務董事、終端 BG CEO、智能汽車解決方案 BU CEO 餘承東説,“通過盤古的底層能力加持,華為將為用户帶來智慧終端交互、高階生產力效率、個性化服務的全新 AI 體驗變革。” 基於 AI 大模型的文本生成是 HarmonyOS 4 的一部分。隨着大模型的日益發展,小藝獲得全新升級,增強了交互、生產力和個性化服務三個方面的能力。 文本生成和總結能力,這是各家推出大模型應用的標準能力,HarmonyOS 4 也不例外。通過小藝,可識別圖片中的內容和文字,能朗讀文字內容並接入更多服務。 高通產品管理高級副總裁兼 AI 負責人 Ziad Asghar 認為,大模型將迅速重塑人機交互方式。 HarmonyOS 4 的交互變化看上去並不顯著。在語音交互基礎上,擴展了文字、圖片和文檔等多種形式的輸入。比如,用日常説話的方式自然地與 AI 交流,小藝可自動完成指定任務。這一點在 iPhone 通過 Siri 早已能達成。 但是,作為首個具備 AI 大模型能力的智能助手,小藝對自然語義的理解更深。 舉個例子,iPhone 的 AI 助手 Siri 需要 C 端用户輸入的語音指令語義清晰而精確,而 HarmonyOS 4 則能理解相對含義不太明顯的語音指令,因而搭載 HarmonyOS 4 的智能手機,能更精準、更迅速地完成任務。 此外,由於小藝具有的大模型 AI 泛化能力和手機智能助手連接了多種服務和特殊場景,因此也能比之前更快地獲取服務。 比如,若收到一張活動海報圖片,C 端用户對小藝下達指令,AI 能自動識別圖片上的地址,給出導航按鈕或保存海報電話作為聯繫方式。 若瀏覽一篇數千字的英文新聞,小藝可直接速讀文章、做翻譯並完成摘要,也能回答與該篇新聞有關的問題。 HarmonyOS 4 還有生成能力。比如自動生成各類商業電子郵件內容或生成圖像;也能用終端保存的個性化照片,小藝調用 AI 畫圖功能生成各種風格的圖片。 隨着 C 端用户和小藝的持續交流,小藝會持續提升 AI 能力。這些交互數據會保留在端側,以保護用户隱私。 個性化是智能手機應用的特徵。小藝具備的記憶能力會隨着長時間使用,越來越懂 “主人”,給出的建議更貼心:比如出行,在出行前提供完備而豐富的出行信息,落地後又能提供本地信息,並根據用户習慣,實現個性化推薦。 據華為透露,小藝這些新的能力,將在 8 月下旬開啓公開測試體驗。 這不是華為首次嘗試將 AI 大模型接入移動終端。今年 3 月,華為發佈的 P60 手機,自帶智慧搜圖功能。這項功能基於多模態大模型技術,通過在手機端側對模型做小型化處理,實現了手機側的大模型運行。 蘋果動作緩慢,高通熱情高漲 瞄上端側 AI 大模型能力的智能終端商不只有華為,還有蘋果。 蘋果正在秘密研發的 GPT 軟件叫做 Apple GPT,基於蘋果自研的 Ajax 框架開發。 但目前,Apple GPT 缺乏更多細節,外界難以知曉其技術或應用能力究竟有哪些亮點。對此,蘋果明確表示,目前尚未決定 Apple GPT 未來的開發方向。 此前,在第二財季財報電話會議中,蘋果 CEO 庫克承認,Al 潛力巨大,但如何使用 AI 技術,仍需要深入思考。庫克説,蘋果已將 AI 技術整合進產品和服務,未來也將繼續這一進程。 全球首個面向消費級市場、大規模落地、應用 NLP 技術的智能助手,iPhone Siri,今年已經 12 歲。與剛剛全新升級的華為小藝、小米小愛、百度小度一眾 “晚輩” 相比,Siri 非但不智能,還顯得有點 “智障”。 外界認為,蘋果落地 GPT 能力的載體很可能是這個呈現 “暮年” 狀態的 Siri,但這未能得到蘋果的證實。 儘管如此,蘋果入局端側 AI 大模型的跡象非常多。比如,今年 1 月,蘋果啓動一項新計劃,為 Apple Books 添加數字旁白功能,以從書面文本中自動生成高質量的 AI 旁白音頻;在 iOS17 更新版,蘋果用 Transformer 語言模型完善輸入法的預測和拼寫糾正功能。 還有,新款 AirPods Pro 通過機器學習(ML)實現自適應音頻模式,可通過識別外部環境自動調節音量;iPadOS 17 用機器學習模型實現對 PDF 字段的識別;Vision Pro 使用機器學習技術 “編碼器 - 解碼器” 神經網絡為用户構建數字化身。 蘋果如何佈局 AI 賽道,這是一個系統大問題,很難用數百字説明白。但 Siri 開發團隊的技術工程師對改變 Siri 的 “蠢笨” 看起來缺乏真正的動力,背後折射了 “組織功能障礙和缺乏雄心” 的現實,很可能會影響蘋果在端側落地 AI 大模型的效率。 但蘋果的低效,不能改變端側 AI 大模型在智能終端的部署規模,這是無可存疑的事實。因為包括高通、Meta、OpenAI、谷歌、亞馬遜、騰訊和百度,都在等都致力於實現 AI 大模型在移動終端的輕量化部署。 OpenAI 團隊在 7 月第四周推出覆蓋 iOS/安卓系統的移動端 ChatGPT 應用;Meta 將與高通合作,從 2024 年起,其開源大模型 Llama 2 將能在旗艦智能手機和 PC 上運行;高通表示正在將更多生成式 AI 用例向邊緣側遷移,目前,參數超過 10 億的 AI 模型已經能夠在手機上運行,且性能和精度達到與雲端相似的水平。 谷歌、騰訊、百度等已將模型壓縮技術緊密結合移動端模型部署框架/工具。 其中,高通對此熱情高漲。高通首席執行官克里斯蒂亞諾·阿蒙在一份聲明中強調,高通能在手機上而不是雲服務器上運行 AI 模型,這為高通提供了實現 “拐點” 的機會,從而推動未來的增長。 “總之,我們處於獨特的地位,可以幫助塑造和利用即將到來的設備上的 Gen AI 機會。” 阿蒙説。 智能手機整體市場下滑態勢何時能停止,目前仍無法確定;但是,端側 AI 大模型賽道迎來的這波眾多 B 端參與者,是重塑這個日漸低迷的電子消費品類的應用和市場格局的新希望所在。