* 该公司采用人工智能友好硬件的时间较晚 * 内部备忘录称,人工智能软件存在 “显著差距” * 定制 AI 芯片报废,计划推出更雄心勃勃的新芯片 * 生成性人工智能现在加剧了公司的产能紧缩 作者:凯蒂·保罗、克里斯特尔·胡、斯蒂芬·内利斯和安娜·童 路透 4 月 25 日 - 根据一份日期为 9 月 1 日的公司备忘录,随着 2022 年夏季即将结束,Meta 首席执行官马克·扎克伯格召集他的高级副手,对公司的计算能力进行了五个小时的剖析,重点是公司从事尖端人工智能工作的能力。路透社评论了 20 个。 他们面临着一个棘手的问题:根据备忘录、公司声明和对 12 名知情人士的采访,尽管这家社交媒体巨头在人工智能研究方面进行了高调投资,但在为其主营业务采用昂贵的人工智能友好型硬件和软件系统方面进展缓慢,阻碍了其跟上大规模创新步伐的能力,尽管它越来越依赖人工智能来支持自己的增长。这些知情人士要求匿名讨论公司内部事务。 “当涉及到人工智能开发时,我们在工具、工作流和流程方面有很大的差距。这份备忘录由基础设施新任负责人 Santosh Janardhan 撰写,于 9 月份发布在 Meta 的内部留言板上,现在首次被报道。 它补充说,支持人工智能工作将需要 Meta(META.O)“从根本上改变我们的物理基础设施设计、我们的软件系统以及我们提供稳定平台的方法”。 一年多来,Meta 一直在从事一个庞大的项目,以完善其人工智能基础设施。尽管该公司已公开承认在人工智能硬件趋势上 “有点追赶”,但此次全面改革的细节 -- 包括产能紧缩、领导层更迭和一个废弃的人工智能芯片项目 -- 此前从未报道过。 当被问及这份备忘录和重组时,Meta 发言人乔恩·卡维尔表示,该公司在创建和部署大规模最先进的基础设施以及人工智能研究和工程方面的深厚专业知识方面拥有经过证明的记录。 卡维尔说:“当我们为我们的应用和消费产品系列带来新的人工智能支持的体验时,我们有信心我们有能力继续扩展我们的基础设施的能力,以满足我们的短期和长期需求。” 他拒绝就 Meta 是否放弃其人工智能芯片发表评论。 贾纳尔汉和其他高管没有批准通过该公司提出的采访请求。 根据 Meta 披露的公司信息,此次改革使 Meta 的资本支出每季度增加约 40 亿美元 -- 几乎是 2021 年支出的两倍 -- 并导致 Meta 暂停或取消了之前计划在四个地点建设的数据中心。 这些投资恰逢 Meta 经历了一段严重的财务紧缩时期,自去年 11 月以来,Meta 一直在以自互联网泡沫破裂以来未曾见过的规模裁员。 与此同时,微软支持的 OpenAI 的 ChatGPT 在 11 月 30 日首次亮相后,迅速成为历史上增长最快的消费者应用程序,引发了科技巨头之间的军备竞赛,他们使用所谓的生成式人工智能发布产品,这种人工智能除了像其他人工智能一样识别数据中的模式外,还会根据提示创建类似人类的书面和视觉内容。 其中五位消息人士称,生产性人工智能吞噬了大量的计算能力,放大了 Meta 容量争夺的紧迫性。 落在后面 这五位消息人士称,问题的一个关键来源可以追溯到 Meta 迟来的对图形处理单元 (GPU) 的接受,用于人工智能工作。 GPU 芯片是唯一非常适合人工智能处理的芯片,因为它们可以同时执行大量任务,减少处理数十亿条数据所需的时间。 然而,消息人士称,图形处理器也比其他芯片更昂贵,芯片制造商英伟达公司 (NVDA.O) 控制着 80% 的市场,并在配套软件方面保持着压倒性的领先地位。 NVIDIA 没有回应对这篇报道的置评请求。 相反,直到去年,Meta 在很大程度上使用该公司的商用中央处理器 (CPU) 来运行人工智能工作负载,CPU 是计算世界的主力芯片,几十年来一直填满了数据中心,但人工智能工作表现不佳。 据其中两位消息人士透露,该公司还开始使用自己设计的定制芯片进行推理,这是一个人工智能过程,算法根据大量数据进行训练,做出判断并对提示做出回应。 这两位知情人士表示,到 2021 年,事实证明,这种双管齐下的方法比围绕 GPU 构建的方法更慢、效率更低,后者在运行不同类型的型号时也比 Meta 的芯片更灵活。 Meta 拒绝就其人工智能芯片的表现置评。 其中四位消息人士称,随着扎克伯格将公司转向虚拟世界 - 一套由增强和虚拟现实实现的数字世界 - 其能力紧缩正在减缓其部署人工智能以应对威胁的能力,比如社交媒体竞争对手 TikTok 的崛起和苹果主导的广告隐私变化。 这些挫折引起了 Meta 前董事会成员彼得·蒂尔的注意,他于 2022 年初辞职,但没有做出任何解释。 据两位知情人士透露,在离开之前的一次董事会会议上,泰尔告诉扎克伯格和他的高管,他们对 Meta 的核心社交媒体业务感到自满,同时过于关注虚拟现实,他表示,这让公司很容易受到 TikTok 的挑战。 Meta 拒绝就此次谈话置评。 迎头赶上 一位消息人士称,在取消了 Meta 自己的定制推理芯片的大规模推出计划后,高管们转而在 2022 年订购了价值数十亿美元的 NVIDIA 图形处理器。 Meta 拒绝对该订单置评。 到那时,Meta 已经落后于谷歌等同行几步,谷歌在 2015 年开始部署自己的定制版本的 GPU,称为 TPU。 同年春天,高管们还着手重组 Meta 的人工智能部门,任命了两名新的工程主管,其中包括 9 月备忘录的作者贾纳汉。 根据 Meta 在 LinkedIn 上的个人资料和一位熟悉离职情况的消息人士的说法,在长达数月的动荡期间,有十几名高管离开了 Meta,这几乎是人工智能基础设施领导层的彻底更迭。 Meta 接下来开始重组其数据中心,以适应即将到来的 GPU,这些 GPU 比 CPU 消耗更多的电力和产生更多的热量,并且必须通过它们之间的专门网络紧密地聚集在一起。 根据 Janardhan 的备忘录和四位熟悉该项目的消息人士的说法,这些设施需要 24 到 32 倍的网络容量和新的液体冷却系统来管理星团的热量,这要求它们被 “完全重新设计”,这些消息的细节之前没有披露。 随着工作的进行,Meta 制定了内部计划,开始开发一种新的、更雄心勃勃的内部芯片,它将像 GPU 一样,能够训练人工智能模型和执行推理。两位消息人士称,该项目之前没有报道,将于 2025 年左右完成。 Meta 发言人卡维尔表示,在过渡到新设计时暂停的数据中心建设将于今年晚些时候恢复。他拒绝就芯片项目置评。 权衡取舍 在扩大其 GPU 能力的同时,Meta 目前几乎没有什么可展示的,因为微软和谷歌等竞争对手正在推动商业生成性人工智能产品的公开发布。 Meta 首席财务官苏珊·李 (Susan Li) 在 2 月份承认,Meta 目前并没有将太多的计算机投入到创造性工作中,她表示,基本上我们所有的人工智能能力都流向了广告、提要和 Reels,这是一种类似 TikTok 的短视频格式,受到年轻用户的欢迎。 根据其中四位消息人士的说法,Meta 直到 11 月份推出 ChatGPT 后才优先开发生成性人工智能产品。他们说,尽管 Facebook 的研究实验室博览会自 2021 年末以来一直在发布这项技术的原型,但该公司并没有专注于将其广受好评的研究转化为产品。 随着投资者兴趣的飙升,这种情况正在改变。扎克伯格在 2 月份宣布了一个新的顶级产生式人工智能团队,他说这将 “推动” 公司在该领域的工作。 首席技术官安德鲁·博斯沃思本月也表示,生成性人工智能是他和扎克伯格花费时间最多的领域,他预测 Meta 将在今年发布一款产品。 两名熟悉新团队的人士表示,该团队的工作处于早期阶段,重点是建立一个基础模型,这是一个核心项目,以后可以针对不同的产品进行微调和调整。 Meta 发言人卡维尔表示,一年多来,该公司一直在不同的团队上开发生成性人工智能产品。他证实,自从 ChatGPT 到来后的几个月里,工作已经加快了。 Meta 的资本支出增加 Meta 的美国数据中心状况