英伟达面临来自客户如 OpenAI 和 Meta 的日益竞争 英伟达预计将揭示与 170 亿美元 Groq 交易相关的新产品 英伟达的人工智能战略专注于推理和 ‘代理人工智能’ 的进展 英伟达的以 CPU 为中心的服务器解决了 ‘代理协调’ 的瓶颈 作者:Stephen Nellis 和 Zaheer Kachwala 旧金山,3 月 13 日(路透社)- 当黄仁勋走上挤满观众的冰球场舞台,开启英伟达(NVDA.O)年度开发者大会时,他可能会揭示旨在保持这家人工智能芯片制造商在日益增长的竞争对手中领先的产品和合作伙伴关系。 英伟达 GTC 会议,持续一周,已成为首席执行官黄仁勋展示英伟达在芯片、数据中心、芯片编程软件 CUDA、被称为 AI 代理的数字助手以及物理 AI(如机器人)方面的进展的首选活动。 今年,这一为期四天的活动尤为重要,因为投资者将寻求确保英伟达将利润再投资于人工智能生态系统的战略正在取得成效。eMarketer 分析师 Jacob Bourne 表示:“我预计英伟达将展示从 Rubin 到 Feynman 的全栈路线图更新,同时强调推理、代理人工智能、网络和人工智能工厂基础设施。” 英伟达的芯片位于全球政府和公司在数据中心投资数千亿美元的中心,但该公司正面临来自其他芯片制造商甚至一些客户的竞争,这些客户正在开发自己的芯片。分析师告诉路透社,他们预计整体人工智能芯片市场将继续增长,但英伟达的市场份额将有所缩小,因为人工智能芯片市场正在迅速变化,人工智能代理在计算应用之间来回穿梭,代表人类执行任务。这与训练阶段不同,人工智能实验室将许多英伟达芯片连接在一起,形成一台计算机,以处理大量数据,从而完善其人工智能模型。 这些代理预计将变得如此众多,以至于要求他们完成工作的用户甚至需要一个新的人工智能中层管理者层——技术人员称之为 ‘协调’ 层——来坐在人类用户和他们的代理队伍之间。 在某种程度上,分析师表示,这对英伟达来说是个好消息,因为这表明人工智能变得更加有用。 但这些广泛被称为人工智能行业中的 ‘推理’ 的任务,也可以在其他类型的芯片上运行,包括一些大型英伟达客户如 OpenAI 和 Meta(META.O)最近表示计划每六个月发布一次新人工智能芯片所能自行制造的芯片。 “与一年前相比,英伟达肯定会面临更多竞争,” Summit Insights Group 的董事总经理 Chan KinNgai 说。“今天,英伟达在训练和推理市场的市场份额仍接近 90%。” “我们认为,英伟达将在 2027 年开始看到市场份额的流失,特别是在推理市场,随着内部 ASIC 项目的规模逐渐扩大,” 他说,指的是为单一功能或定制工作负载量身定制的应用特定集成电路,提供比通用图形处理单元更高的效率。 英伟达正在加强防御 该公司在 12 月花费 170 亿美元收购了 Groq,这是一家专注于快速和廉价推理计算工作的芯片初创公司。在上个月的财报电话会议上,黄仁勋谈到 Groq 时表示,该公司将在 GTC 展示英伟达如何将 Groq 的超快人工智能技术整合到现有的 CUDA 平台中。 Third Bridge 的分析师 William McGonigle 表示,他的公司预计英伟达将推出一系列新服务器,将 Groq 的芯片与英伟达的网络技术结合,以创造一种快速且具有成本效益的产品。 另一种对英伟达构成日益竞争威胁的芯片是中央处理器(CPU),这种芯片长期以来受到英特尔(INTC.O)和超微(AMD.O)的推崇。 虽然这些芯片在近年来被英伟达的图形处理单元(GPU)所取代,但 McGonigle 表示它们 “重新回到焦点”,并预计英伟达将展示仅使用其 CPU 的服务器,黄仁勋在最近的财报电话会议上对此进行了强调。 “随着代理人工智能的兴起,瓶颈现在出现在代理协调层,由 CPU 执行,” McGonigle 说。 分析师还预计英伟达将详细说明为何在 Lumentum 和 Coherent 各投资 20 亿美元,这两家公司制造用于通过光束在芯片之间传递信息的激光。这些激光在所谓的共封装光学中的使用可能有助于加快英伟达芯片在大型数据中心内部的连接,但目前的生产量不足以匹配英伟达每年销售的芯片数量。 “英伟达可能会将共封装光学框架作为更高效连接大规模人工智能集群的关键,但挑战在于使其足够经济以便大规模部署,” eMarketer 的 Bourne 说。