
長江證券:蘋果發佈 Apple Intelligence 智能助手 異構芯片或成 AI 算力新方向

蘋果在 2024 年全球開發者大會上推出的智能助手 Apple Intelligence,集成強大的生成模型,旨在高效處理用户日常任務。此助手由基礎模型 AFM 支持,搭載谷歌的 TPU 芯片,提升計算效率。此外,Apple Intelligence 具有多種功能,包括撰寫和潤色文本、創建趣圖等,目前限於註冊開發者試用,訂閲費用為 99 美元/年。
智通財經 APP 獲悉,長江證券發佈研報稱,在 2024 年的全球開發者大會上,蘋果 (AAPL.US) 推出了個人智能助理 Apple Intelligence。該助手包含了多個功能強大的生成模型,可以快速、高效地處理用户日常任務,並能即時適應用户當前的活動。此外,蘋果發佈了基礎模型 AFM,為底層操作系統賦能。Apple Intelligence 正是由 AFM 基礎模型賦能的。在算力層面,AFM 模型由谷歌 (GOOG.US) TPU 算力芯片提供支持,該 TPU 性能追及英偉達 (NVDA.US) 旗艦算力芯片。
蘋果發佈 Apple Intelligence 智能助手
蘋果發佈了基礎模型 AFM,為底層操作系統賦能。在 2024 年的全球開發者大會上,蘋果推出了個人智能助理 Apple Intelligence。Apple Intelligence 包含了多個功能強大的生成模型,可以快速、高效地處理用户日常任務,並能即時適應用户當前的活動。Apple Intelligence 可以實現撰寫和潤色文本、優先處理和總結通知、為與家人朋友的對話創建有趣的圖片等功能,以及採取應用內操作以簡化跨應用交互。Apple Intelligence 將被搭載於 IOS18、IOS18ipad 以及 MacOS18 操作系統上。目前 Apple Intelligence 搭載於 iOS18.1Beta 版上,僅限註冊開發者試用,訂閲價格為 99 美金一年;普通用户仍需要排隊等待。
Apple Intelligence 由 AFM 基礎模型賦能
AFM 基礎模型主要包含了端側模型和雲端模型兩個部分。其中端側模型專為端側應用的特定場景所設計,只能處理語言相關的單模態任務,可以本地化搭載於 iphone、ipad、Mac 等設備上,模型包含 30 億參數量。雲端模型為私有云應用場景所設計,具備多模態能力,有更高的泛化能力,可應對更加通用的任務。這兩個基礎模型是蘋果創建的生成式模型家族中的一部分,除了上述兩個模型,Apple Intelligence 還包含了一個編碼模型和一個擴散模型。編碼模型基於 AFM 語言模型,用於為 Xcode 注入智能功能;擴散模型幫助用户以視覺方式表達自己,比如在 Messages 應用中使用。
AFM 雲端模型性能追及 GPT-3.5,略遜於 GPT-4。
在模型性能評估階段,蘋果設計了 1393 個任務,將 AFM 模型與其他主流模型的性能進行了對比。對比結果顯示,AFM 雲端模型性能超越 Mixtral-8x22 混合專家模型、GPT-3.5 等模型,略遜於 GPT-4 和 LLaMA-3-70B 模型;在端側模型方面,AFM 端側模型性能接近市場主流端側模型。人類測評結果顯示,AFM 端側模型性能超越 Gemma-7B、Phi-3-mini、Mistral-7B、Gemma-2B 等主流模型,略遜於 LLaMA-3-8B 模型;結果證明了 AFM 端側模型的優異性能,有望在 iPhone、iPad 等設備上發揮較高實用性。
異構芯片或成 AI 算力發展新方向
在算力層面,AFM 模型由谷歌 TPU 算力芯片提供支持。谷歌為本次訓練提供了算力支持,雲端的 AFM-server 模型由 8192 個 TPU V4 算力芯片訓練得到,在訓練階段,蘋果把 8192 芯片分成 8 組,每組 1024 個芯片相互串聯形成一個基本單位,各組之間保持平行關係,訓練數據與迭代僅在組內完成;端側的 AFM-on-device 模型由 2048 個 TPU V5p 算力芯片訓練得到。
谷歌 TPU 性能追及英偉達旗艦算力芯片。TPU(Tensor Processing Unit),是一種專為處理張量運算而設計的 ASIC 芯片。TPU 通過脈動陣列機制實現高效運算。與 GPU 相比,TPU 不需要再頻繁地訪問內存,減少了與存儲器的交互次數,從而大幅度提高了計算效率。因此,TPU 的有效算力利用率相比於 GPU 更高;GPU 的算力利用率通常為 20%-40%,而 TPU 的算力利用率往往超過 50%。
風險提示
1、AI 技術推進不及預期;
2、下游應用需求不及預期。

