作者 | 范昕茹 编辑 | 周智宇 端侧模型成了科技巨头的兵家必争之地,继在谷歌、三星和微软后,苹果也加入了战局。 4 月 25 日凌晨,苹果发布了 OpenELM。这是一个全新的开源语言模型(LLM)系列,可以完全在本地设备上运行,无需连接云服务器。 过去苹果生态相对封闭,如今它也以一个开放的姿态,加入大模型的开源浪潮当中,希望借此追上 AI 热潮。 也许在 6 月的全球开发者大会 (WWDC 2024),外界就能够窥得苹果如何通过 OpenELM 在 AI 技术上创新,并将其搭载到 iPhone 等设备上,提升效率。 这也会是苹果在备受投资者诟病多年,认为其在 AI、大模型上显得 “慢一拍” 后的翻身之战。凭借苹果自身拥有的芯片资源、软硬件一体化的生态系统,看似 “慢一拍” 的苹果或许也将拥有弯道超车的机会。 围困 在今年 2 月的投资者电话会议中,Tim Cook 这样解释苹果在人工智能领域的 “慢一拍”。 “我们的模式,一直是先做工作,然后谈论工作,而不是抢先一步。” 会上,Tim Cook 透露,苹果内部正在进行大量 AI 方面的工作,并将在今年晚些时候对此进行讨论。 不过,还没等到 “今年晚些时候”,苹果便发布了自己的开源语言模型 OpenELM。 OpenELM 是一系列开源语言模型,分为指令微调和预训练两种模型,有 0.27B、0.45B、1.08B、3.04B 四种参数,提供生成文本、代码、翻译、总结摘要等功能。 相比目前大多数 8B 左右的模型,其对芯片的要求也更低一些。但在大模型能力上,苹果表示,与 1.2B 参数的 OLMo 模型相比,1.1B 参数的 OpenELM 准确率高出 2.36%,但预训练需要的 token 数量却只有 OLMo 的一半。 相比此前苹果已经公布的 MM1 多模态大语言模型,此次发布的 OpenELM 不仅体量更小,其最受人关注的一点在于,这系列语言模型无需接入云端,即可在端侧完成推理和微调,是一款专门针对手机等移动设备开发的端侧大模型。 所谓端侧大模型,通常指的是在终端设备上(如手机、平板电脑、智能音箱等)部署和运行的大模型。和 ChatGPT 等大模型不同,这类大模型可以在终端设备上完成推理任务,进行微调,而不受网络的限制。 其实,几乎在大模型成为科技圈流行词的时候,如何将大模型落地端侧,尤其是和人们日常生活息息相关的手机上的讨论就层出不穷。然而,受制于大模型的体量以及芯片性能、能耗等因素,汽车曾被视为是最可能最先运行端侧模型的终端。 不过,经过一年多的探索,随着大模型性能的不断提升,参数更少、性能更强的大模型开始出现,给了模型落地端侧的可能,也让搭载端侧模型的 AI Phone 成为各家科技厂商追逐的重心。 如今,市面上主流手机厂商几乎都已经推出了自家的端侧大模型。例如 OPPO 的 AndesGPT,vivo 的蓝心大模型,小米方面则有大模型 MiLM,三星也推出 Galaxy AI。 最近一段时间,各大科技厂商更是密集发布了一波端侧大模型。 就在 OpenELM 发布前 2 天,4 月 23 日,微软在其官网开源了可以在端侧部署的小语言模型 Phi-3-mini。更早之前,Meta 发布了其最新开源模型 Llama3,提供 8B 和 70B 的预训练和指令微调版本。随后,高通宣布和 Meta 合作,优化 Llama3 在手机、PC 等端侧设备的表现。而在国内,商汤刚刚发布了 1.8B 的 SenseChat-Lite 版本端侧大模型。 这一次,苹果似乎又姗姗来迟。 突围 近几年,苹果已经很少能够推出颠覆性的产品,在所有产品线中,iPhone 成为苹果营收的最大功臣。苹果公布的 2024 年第一财季数据显示,苹果 2023 年第四季度的营收为 1196 亿美元,同比增长 2%;利润 403 亿美元,同比增长 12%。其中,iPhone 贡献了 697 亿美元,占比超过了 58%。 但近年来,iPhone 的销售也备受挑战。4 月 25 日,国际数据公司(IDC)发布的最新手机季度跟踪报告显示,2024 年第一季度,中国智能手机市场整体出货量约 6926 万台,同比增长 6.5%,市场表现高于预期。与此同时,iPhone 在华销售同比下降 6.6%,市场占有率也随之降至 15.6%,和 15.7% 的 OPPO 并列第三。荣耀和华为的出货量则并列前二。 IDC 中国区副总裁王吉平认为,此次荣耀登顶,AI 成为关键增长引擎。得益于 AI 功能,荣耀全新旗舰 Magic6 系列首销第一季度出货量超过上一代产品前二季度出货量之和。 在各家手机厂商纷纷进入 AI 手机时代,处于压力之下的苹果,也急需加入大模型的战争来赢得市场信心。 不过,苹果还有机会。 如今,对一些手机厂商来说,单纯把大模型 “塞” 进手机似乎已经不是最大的难题,问题在于如何利用大模型给到用户一个差异化、个性化甚至颠覆性的体验。这不仅考验端侧大模型的能力,手机芯片的性能和能耗控制,还需要大模型和手机软硬件系统的深度融合,渗透到手机应用的方方面面。 在这一点上,选择自研芯片,从一开始就强调软硬件一体化,有着完整开发生态的苹果显然占据优势。 目前,无论是国内还是国际大厂,关于 AI 手机的探索大多采取的是大模型厂商、芯片厂商和手机厂商三方合作的方式进行。例如,Meta 选择与高通合作,探索 Llama3 8B、70B 大模型落地端侧的可能。更早之前,阿里云旗下大模型通义千问想要适配手机端则需要联手联发科。而大多数手机厂商都没有自研芯片,需要依赖芯片厂商的供给。这就意味着额外的定制成本及适配、优化成本。 同时拥有自研芯片、大模型以及软硬件生态的苹果可以省去其中的许多麻烦。 例如,OpenELM 的基准测试就是在苹果设备上完成的。官方论文显示,OpenELM 的基准测试使用的是配备 M2 Max 芯片,64GB 内存,运行 macOS 14.4.1 版本的 Macbook Pro。不仅如此,苹果还发布了将模型转换为 MLX 库的代码,以便技术人员在 Apple 设备上对大模型进行推理和微调。 这意味着,OpenELM 可以顺畅地融入苹果整个生态圈,打通芯片、手机硬件和软件层的隔阂,更好地对大模型进行系统层面的适配和优化。这是其他手机厂商所不具备的优势。 软硬件一体的策略曾使 iPhone 在手机行业中保持了多年的领先。近年来,苹果在自研芯片、软硬件生态一体化上的坚持,或许将帮助苹果在大模型时代获得一个弯道超车的机会。从 iPhone 到 AI Phone,看起来已经不远。