--- title: "自研 AI 芯片浪潮席卷大厂! Meta(META.US) 拟今年部署自研芯片 聚焦 AI 推理端" type: "News" locale: "zh-CN" url: "https://longbridge.com/zh-CN/news/107279204.md" description: "Meta Platforms 计划今年在其数据中心部署一款新版本的定制化 AI 芯片,以减少对英伟达旗下昂贵 AI 芯片的依赖。这将帮助他们节省能源和芯片采购成本,支持其人工智能技术的发展。此举也是谷歌和微软选择自研 AI 芯片的原因之一。Meta 一直在提升计算能力以支持其生成式 AI 产品,包括 Meta AI、Ray-Ban 智能眼镜等。Meta 已经斥资数十亿美元积累了大量 AI 芯片,并重新配置了数据中心。此举将在一定程度上抵消 AI 技术带来的巨大成本。" datetime: "2024-02-02T04:35:05.000Z" locales: - [zh-CN](https://longbridge.com/zh-CN/news/107279204.md) - [en](https://longbridge.com/en/news/107279204.md) - [zh-HK](https://longbridge.com/zh-HK/news/107279204.md) --- # 自研 AI 芯片浪潮席卷大厂! Meta(META.US) 拟今年部署自研芯片 聚焦 AI 推理端 智通财经 APP 获悉,社交媒体 Facebook 和 Instagram 母公司 Meta Platforms(META.US) 计划今年在其数据中心部署一款新版本的定制化 AI 芯片,旨在支持其人工智能 (AI) 技术发展。这款芯片是 Meta 去年宣布的 “第二代内部芯片生产线”,可能有助于减少对占据 AI 芯片市场主导地位的英伟达 (NVDA.US) 旗下昂贵 AI 芯片的重度依赖——这也是谷歌和微软选择自研 AI 芯片的原因之一,并在 Meta 计划推出新的人工智能产品之际,控制与运行人工智能训练/推理工作负载相关的不断上升的成本。 这家全球最大规模的社交媒体公司一直在不断提升计算能力,以支持对算力和电力消耗极高的生成式人工智能产品,**该科技巨头正在将其开发的生成式 AI 产品 Meta AI 推向全球的 Facebook、Instagram 和 WhatsApp 等 Meta 家族应用程序,以及 Ray-Ban 智能眼镜等硬件设备。Meta 已经斥资数十亿美元积累了大量 AI 芯片,比如英伟达 H100,并重新配置了数据中心以适应这些芯片。** 硅研究集团 SemiAnalysis 的创始人迪伦•帕特尔 (Dylan Patel) 表示,以 Meta 的运营规模,成功部署自己的 AI 芯片,每年可能将节省数亿美元的能源成本和数十亿美元的芯片采购成本。 运行 ChatGPT 等生成式人工智能应用所需的芯片、基础设施和能源已经成为科技公司投资的 “巨大天坑”,在一定程度上抵消了围绕这项技术的兴奋热潮所带来的收益。 **科技巨头们纷纷拥抱自研 AI 芯片** Meta 的一位发言人证实了将于 2024 年投产的计划,称该芯片将与该公司正在购买的数十万个现成英伟达 H100 等 AI 芯片协同工作。该发言人在一份声明中表示:“我们认为,我们内部开发的 AI 加速器在为 Meta 特定的 AI 工作负载提供最佳的性能和效率组合方面,将与市售的商用 AI 芯片形成高度互补。” Meta 首席执行官马克·扎克伯格在上个月曾表示,**该公司计划在今年年底前拥有大约 35 万颗来自英伟达的旗舰 AI 芯片——H100,这是英伟达研发的当前全球最受欢迎的用于人工智能工作负载的服务器 GPU。他在当时强调,与自研版全新 AI 芯片以及其他潜在供应商的 AI 芯片加起来后,Meta 将累积等效于 60 万个 H100 AI 芯片的计算能力。** 作为该计划的一部分,部署自己的自研 AI 芯片对 Meta 的内部人工智能芯片项目来说是一个积极的转折,此前该公司高管在 2022 年决定停止该芯片的 “第一次迭代”。 相反,该公司选择购买价值数十亿美元的英伟达 AI 芯片,后者在一个名为 “训练” 的人工智能负载工作过程中几乎占据垄断地位,该过程涉及将大量数据集输入模型,教它们如何执行任务。由于英伟达 AI 芯片的独有架构,英伟达 H100 等芯片在推理领域同样能够胜任,但是推理领域算力要求远不及训练端,因此在推理领域面临的竞争对手相对较多。 相比于英伟达或者 AMD 的通用型 AI 芯片,自研 AI 芯片,也被称作 ASIC,往往更适合科技公司本身的人工智能工作负载需求且成本较低。 比如,**云计算巨头微软和亚马逊选择自研 AI 芯片主要是为了优化特定 AI 计算任务的性能和成本效率,同时减少对英伟达等外部供应商的依赖。自研 AI 芯片往往能够更好地整合进公司的云计算平台和服务中,提供定制化的解决方案以满足特定的业务需求。** 全球第一大公有云巨头——亚马逊旗下的 AWS 近期宣布推出为生成式 AI 和机器学习训练而设计全新自研 AI 芯片 AWS Trainium2,性能比上一代芯片提高到 4 倍,可提供 65ExaFlops 超算性能。微软近期宣布推出第一款定制的自研 CPU 系列 Azure Cobalt 和 AI 加速芯片 Azure Maia,后者是微软首款人工智能芯片,主要针对大语言模型训练,预计将于年初开始在微软 Azure 数据中心推出,该数据中心还将结合英伟达最新款 AI 加速器。另一大云巨头谷歌近期宣布推出新版本的 TPU 芯片 TPU v5p,旨在大幅缩减训练大语言模型时间投入,v5p 是 2023 年早些时候全面推出的 Cloud TPU v5e 的更新版本。 **Meta 自研版全新 AI 芯片聚焦推理端** 相较于 AI 训练,AI 推理领域对于 “海量数据轰炸” 应用背景下的 GPU 并行化算力需求远远不及训练领域,推理进程涉及应用已经训练好的模型来进行决策或识别,极度擅长复杂逻辑处理任务和控制流任务的以 CPU 为核心的中央处理器足以高效率地应付诸多推理场景。 **从产业发展趋势来看,AI 算力负载大概率将逐步从训练全面向推理端迁移,这意味着 AI 芯片门槛可能将显著降低,覆盖可穿戴设备、电动汽车以及物联网等领域的芯片公司未来有望全面渗透至 AI 推理芯片领域。** 华尔街大行摩根士丹利在 2024 年十大投资策略主题中指出,随着消费类边缘设备在数据处理、存储端和电池续航方面的大幅改进,2024 年将有更多催化剂促使边缘 AI 这一细分领域迎头赶上,AI 行业的发展重点也将从 “训练” 全面转向 “推理”。 边缘 AI 是指在端侧设备 (如 PC、智能手机、IoT 设备和汽车等) 上直接进行 AI 数据流处理的技术。市场研究机构 Gartner 预计到 2025 年,50% 企业数据将在边缘端创建,跨越数十亿台设备。这意味着 AI 大模型的推理 (即应用模型进行决策或识别的过程) 有望批量在端侧设备进行,而不是在远程服务器或云端。 高通 CEO Amon 则指出,**芯片制造商们的主要战场不久后将由 “训练” 转向 “推理”。Amon 在近日接受采访时表示:“随着 AI 大模型变得更精简、能够在设备上运行并专注于推理任务,芯片制造商的主要市场将转向 ‘推理’,即模型应用。预计数据中心也将对专门用于已训练模型推理任务的处理器产生兴趣,一切都将助力推理市场规模超越训练市场。”** 据了解,Meta 的这款全新自研 AI 芯片内部被称为 “Artemis”,和它的前身一样,只能执行一个被称为 “推理” 的人工智能负载工作过程,在这个过程中,模型被要求使用它们的算法来做出排名判断等响应,并对用户的提示做出回应。 有媒体曾在去年报道称,Meta 正在开发一款更有雄心的芯片,像英伟达 H100 一样,能够同时进行训练和推理。 这家总部位于加州门洛帕克的科技巨头曾于去年曾分享了第一代 Meta 训练和推理加速器 (MTIA) 项目的相关细节。但是这一公告仅仅将该版本的芯片描述为一个学习机会。该计划此后并未被 Meta 提及。 帕特尔表示,尽管早期出现了一些难以解决的问题,但在处理 Meta 的推荐模型等推理功能时,推理领域的 AI 芯片可能比耗电的英伟达 H100 等芯片要高效得多。“因此,大量的资金和电力将有望全面节省下来。” ### 相关股票 - [GOOGL.US](https://longbridge.com/zh-CN/quote/GOOGL.US.md) - [META.US](https://longbridge.com/zh-CN/quote/META.US.md) - [GOOG.US](https://longbridge.com/zh-CN/quote/GOOG.US.md) ## 相关资讯与研究 - [眼镜之后,AI 指环、项链争抢智能穿戴万亿风口](https://longbridge.com/zh-CN/news/283254046.md) - [Meta 与博通深化合作,将推出首款 2nm AI 计算加速器](https://longbridge.com/zh-CN/news/282799708.md) - [别人都在卷 Harness, 而 Google 的沉默振聋发聩](https://longbridge.com/zh-CN/news/282771076.md) - [马斯克的 “西方微信” XChat,能打败 WhatsApp 吗?](https://longbridge.com/zh-CN/news/282629490.md) - [Taiwan central player in AI-based computing: Google](https://longbridge.com/zh-CN/news/283259392.md)