
苹果使用谷歌,TPU 训练 AI 模型 英伟达霸主地位面临风险

苹果使用谷歌 TPU 训练 AI 模型,可能威胁到英伟达的市场霸主地位。苹果在报告中详细介绍了他们选择谷歌的处理器进行训练的情况。目前,英伟达的昂贵 GPU 在高端 AI 训练芯片市场占据主导地位,但由于供不应求,其他科技公司也在竞相购买。苹果租用云服务商的服务器进行计算,提高了训练效率和可扩展性。这一举动可能会引发科技公司在 AI 基础设施上过度投资的商业风险。
智通财经 APP 获悉,周一,苹果 (AAPL.US) 表示,其人工智能系统 Apple Intelligence 所依赖的人工智能模型是通过谷歌 (GOOG.US,GOOGL.US) 设计的处理器进行预训练的,这表明大型科技公司在培训尖端 AI 时正在寻找英伟达 (NVDA.US) 的替代品。
苹果在刚刚发布的技术报告中详细介绍了选择谷歌自主开发的 Tensor 处理单元 (TPU) 进行训练的情况。此外,苹果还在周一为部分设备发布了 Apple Intelligence 的预览版。
英伟达昂贵的图形处理单元 (GPU) 在高端 AI 训练芯片市场占据主导地位,过去几年需求量如此之高,以至于很难按所需数量采购。OpenAI、微软 (MSFT.US) 和 Anthropic 都在使用英伟达的 GPU 来训练他们的模型,而其他科技公司,包括谷歌、Meta(META.US)、甲骨文 (ORCL.US) 和特斯拉 (TSLA.US),也在争相购买这些 GPU 来建立他们的 AI 系统和产品。
Meta 首席执行官扎克伯格和 Alphabet 首席执行官桑皮查伊上周都表示,他们的公司以及行业中的其他公司可能在 AI 基础设施上过度投资,但也承认不这样做的商业风险太高。
苹果在其 47 页的报告中没有提到谷歌或英伟达,但指出其 Apple Foundation Model(AFM) 和 AFM 服务器是在 “云 TPU 集群” 上进行训练的。这意味着苹果租用了云服务提供商的服务器来进行计算。苹果在报告中表示:“这种系统使我们能够高效且可扩展地训练 AFM 模型,包括 AFM 设备端、AFM 服务器和更大的模型。”
相比其同行在 OpenAI 于 2022 年末推出 ChatGPT 后迅速拥抱生成式 AI,苹果披露其 AI 计划的时间较晚。周一,苹果推出了 Apple Intelligence。该系统包括多个新功能,如 Siri 的全新外观、更好的自然语言处理和文本字段中的 AI 生成摘要。
在接下来的一年里,苹果计划推出基于生成式 AI 的功能,包括图像生成、表情符号生成以及能够访问用户个人信息并在应用中执行操作的加强版 Siri。
在周一的报告中,苹果表示,设备端 AFM 是在一块由 2048 个 TPU v5p 芯片组成的 “切片” 上进行训练的。这是最先进的 TPU,于去年 12 月首次推出。AFM 服务器是在 8192 个 TPU v4 芯片上进行训练的,这些芯片通过数据中心网络被配置为八个切片协同工作。
根据谷歌网站,最新的 TPU 在预订三年时,每小时的使用成本不到 2 美元。谷歌于 2015 年首次推出 TPU 用于内部工作负载,并于 2017 年向公众开放。它们现在是为人工智能设计的最成熟的定制芯片之一。
尽管如此,谷歌仍是英伟达的主要客户之一。它在训练 AI 系统时使用了英伟达的 GPU 和自家的 TPU,同时也在其云上出售英伟达技术的使用权限。
苹果此前表示,推理过程 (即使用预训练的 AI 模型生成内容或做出预测) 将部分在其数据中心的自有芯片上进行。
这是苹果关于其 AI 系统的第二篇技术论文,此前在六月发布了一份更为概括的版本。苹果当时表示,在开发 AI 模型时使用了 TPU。
苹果计划于周四交易结束后公布季度业绩。

