作者：李丹
来源：硬 AI
英伟达的人工智能（AI）霸主地位面临新挑战，英特尔推出号称性能明显优于英伟达竞品的新一代 AI 芯片。
美东时间 4 月 9 日周二，在今年举办的客户与合作伙伴大会 Intel Vision 2024 期间，英特尔正式发布第三代英特尔 AI 加速器 Gaudi 3。英特尔称，它将为企业应用生成式 AI 带来高性能、开放性和新选择。同时，英特尔还推出了一套全新的开放式可扩展系统、下一代产品和战略合作，加快生成式 AI 的应用。
去年发布新一代 AI 数据中心和个人电脑（PC）芯片新品时，英特尔 CEO 基辛格（Pat Gelsinger）就预告过，将推出用于深度学习和大型生成式 AI 模型的 Gaudi 3。英特尔当时称，Gaudi 3 的性能将优于英伟达的主打 AI 芯片 H100。
本周二，基辛格在 Intel Vision 2024 大会上表示：“创新正在以前所未有的速度前进，这一切都是由芯片推动的——每家公司都在迅速成为 AI 公司。英特尔正在将 AI 带到整个企业的各个角落，从个人电脑（PC ）到数据中心再到边缘（计算）。 我们（英特尔）最新的 Gaudi、至强（Xeon）和 Core 酷睿（Core）平台正在提供一套紧密结合的灵活解决方案，旨在满足客户和合作伙伴不断变化的需求，并充分利用未来的巨大机遇。”
<img class="wscnph" src="https://imageproxy.pbkrs.com/https://wpimg-wscn.awtmt.com/a58bd74b-2e1e-43f3-ba79-c8f9aaeb9972.jpeg?x-oss-process=image/auto-orient,1/interlace,1/resize,w_1440,h_1440/quality,q_95/format,jpg" width="1024" height="576" original-src="https://imageproxy.pbkrs.com/https://wpimg-wscn.awtmt.com/a58bd74b-2e1e-43f3-ba79-c8f9aaeb9972.jpeg"/>
<h2>Gaudi 3 可将模型训练时间较 H100 缩短 50%、推理吞吐量提高 50%</h2>
英特尔介绍，Gaudi 3 采用 5 纳米工艺制造，专为高效的大规模 AI 计算而设计，将为 AI 系统提供通过通用以太网标准连接的数以万计加速器支持。对于那些希望大规模配置生成式 AI 的企业来说，在大语言模型（LLM）和多模态模型的 AI 训练和推理方面，Gaudi 3 可以实现性能和生产率的大飞跃。
英特尔称，对比前代，Gaudi 3 可提供四倍的浮点格式 BF16 AI 计算能力，内存带宽提升 1.5 倍，服务于大规模系统扩展的网络带宽提升两倍。
<img class="wscnph" src="https://imageproxy.pbkrs.com/https://wpimg-wscn.awtmt.com/fd513bc5-3968-4fc2-98e1-69d7aee506aa.jpeg?x-oss-process=image/auto-orient,1/interlace,1/resize,w_1440,h_1440/quality,q_95/format,jpg" width="1024" height="576" original-src="https://imageproxy.pbkrs.com/https://wpimg-wscn.awtmt.com/fd513bc5-3968-4fc2-98e1-69d7aee506aa.jpeg"/>
对比英伟达的芯片 H100，如果应用于 7B 和 13B 参数的 Meta Llama2 模型以及 175B 参数的 OpenAI GPT-3 模型中，Gaudi 3 预计可以让这些模型的训练时间平均缩短 50%。
此外，应用于 7B 和 70B 参数的 Llama 以及 180B 参数的开源 Falcon 模型时，Gaudi 3 的推理吞吐量预计将比 H100 平均高 50%，推理功效平均高 40%。而且，在较长的输入和输出序列上，Gaudi 3 有更大的推理性能优势。
应用于 7B 和 70B 参数的 Llama 以及 180B 参数的 Falcon 模型时，Gaudi 3 的推理速度相比英伟达 H200 提高 30%。
<img class="wscnph" src="https://imageproxy.pbkrs.com/https://wpimg-wscn.awtmt.com/67626378-f0d7-4b81-860b-2617413ab468.jpeg?x-oss-process=image/auto-orient,1/interlace,1/resize,w_1440,h_1440/quality,q_95/format,jpg" width="1024" height="576" original-src="https://imageproxy.pbkrs.com/https://wpimg-wscn.awtmt.com/67626378-f0d7-4b81-860b-2617413ab468.jpeg"/>
英特尔称，Gaudi 3 将在今年第三季度向客户供应，二季度向包括戴尔、HPE、联想和 Supermicro 在内的 OEM 厂商提供，但并未公布 Gaudi 3 的售价范围。
主管至强软件的英特尔副总裁 Das Kamhout 称，英特尔预计，面对英伟达的最新产品，英特尔的 Gaudi 3 料将有很强的竞争力，“从我们具有竞争力的价格、我们独特的开放式集成片上网络来看，我们正在使用行业标准以太网。 我们相信这是一个强大的产品。”
<h2>英特尔 AI 解决方案客户包括 IBM 等 谷歌云将运用机密计算功能</h2>
在 Intel Vision 2024 期间，英特尔介绍其开放可扩展 AI 系统的战略，包括硬件、软件、框架和工具。
英特尔称，这种方式让 AI 领域的参与者能建立了广泛、开放的生态系统，从而提供满足企业特定生成式 AI 需求的解决方案。英特尔战略服务的客户包括设备制造商、数据库提供商、系统集成商、软件和服务提供商等，比如使用 Gaudi 芯片的 NAVER、在其数据库应用第五代至强处理器的 IBM、将与印度客户合作打造 AI 超级计算机的 CtrlS Group。
英特尔还宣布与谷歌云、Thales 和 Cohesity 合作，这三家合作方将在其云实例中运用英特尔的机密计算功能。
<h2>与多家企业合作打造企业 AI 的开放平台</h2>
Intel Vision 2024 期间，英特尔还宣布与 Anyscale、Articul8、DataStax、Domino、Hugging Face、KX Systems、MariaDB、MinIO、Qdrant、红帽（RedHat）、Redis、SAP、VMware、Yellowbrick 和 Zilliz 合作，有意为企业 AI 创建一个开放平台。
英特尔称，这种全行业的努力旨在开发开放的多供应商生成式 AI 系统，通过检索增强生成（RAG）让企业用户达到一流的性能且易于部署生成式 AI。在 RAG 加持的生态系统，通过开放的 LLM 功能，企业能增强在标准云基础设施上运行大量现有专有数据源的能力，从而加快生成式 AI 在企业的应用。
作为这项工作的第一步，英特尔将在基于安全英特尔至强和 Gaudi 的解决方案发布生成式 AI 管道的参考实现，发布技术概念框架，并继续在英特尔 Tiber 开发者云中增加基础设施容量，以实现 RAG 的生态系统开发和验证以及未来的管道。
<h2>发布面向企业 AI 的第六代志强（Xeon）处理器</h2>
除了 Gaudi 3 加速器，英特尔还发布了另一硬件：第六代志强（Xeon）处理器。它提供高性能的解决方案，运行包括 RAG 在内的当前生成式 AI 解决方案。面向所有企业 AI，将于今年第二季度问世。
英特尔介绍，相比二代英特尔至强处理器，代号 Sierra Forest 的 E 核六代志强处理器每瓦性能提高四倍，机架密度提高 2.7 倍。
代号 Granite Rapids 的 P 核六代志强处理器纳入对 MXFP4 数据格式的软件支持，相比使用 FP16 的第四代至强处理器，它的下一个 token 延迟最多可减少 6.5 倍，并且能运行 700 亿个参数的 Llama-2 模型。
<img class="wscnph" src="https://imageproxy.pbkrs.com/https://wpimg-wscn.awtmt.com/41214147-eea1-427d-afd2-0cf1ecfedeb6.jpeg?x-oss-process=image/auto-orient,1/interlace,1/resize,w_1440,h_1440/quality,q_95/format,jpg" width="678" height="381" original-src="https://imageproxy.pbkrs.com/https://wpimg-wscn.awtmt.com/41214147-eea1-427d-afd2-0cf1ecfedeb6.jpeg"/>
<h2>网友评论</h2>
虽然英特尔声称 Gaudi 的性能明显强于 H100，但一些网友似乎并不太看好 Gaudi 的前景。
有一条 3400 多赞的网友评论称，也许 Gaudi 3 是一款更快、更高效的芯片，但如果市场仍然选择英伟达的 H100 芯片，这真的很重要吗？ 英特尔是科技资本枯萎消亡的地方。
<img class="wscnph" src="https://imageproxy.pbkrs.com/https://wpimg-wscn.awtmt.com/f4c4ea1e-6b0e-4cb9-8704-f969fbf56a80.jpeg?x-oss-process=image/auto-orient,1/interlace,1/resize,w_1440,h_1440/quality,q_95/format,jpg" width="758" height="200" original-src="https://imageproxy.pbkrs.com/https://wpimg-wscn.awtmt.com/f4c4ea1e-6b0e-4cb9-8704-f969fbf56a80.jpeg"/>
还有一条评论称，如果英特尔发布一款比 H100 快十倍的产品，那会不会很重要。
<img class="wscnph" src="https://imageproxy.pbkrs.com/https://wpimg-wscn.awtmt.com/55f30aca-5587-49ce-8f4a-1cde3a07f5d1.jpeg?x-oss-process=image/auto-orient,1/interlace,1/resize,w_1440,h_1440/quality,q_95/format,jpg" width="751" height="130" original-src="https://imageproxy.pbkrs.com/https://wpimg-wscn.awtmt.com/55f30aca-5587-49ce-8f4a-1cde3a07f5d1.jpeg"/>
有一条上千点赞的评论提到了谷歌也在周二推出新的芯片，称过去一年涌现了很多新的芯片故事，不知道 Meta 的芯片在哪里。
<img class="wscnph" src="https://imageproxy.pbkrs.com/https://wpimg-wscn.awtmt.com/0557dd7b-f0cc-40df-a14e-747ca66116d2.jpeg?x-oss-process=image/auto-orient,1/interlace,1/resize,w_1440,h_1440/quality,q_95/format,jpg" width="750" height="192" original-src="https://imageproxy.pbkrs.com/https://wpimg-wscn.awtmt.com/0557dd7b-f0cc-40df-a14e-747ca66116d2.jpeg"/>
另一条上千点赞的评论问，现在谁还在使用英特尔架构进行高速计算呢？
<img class="wscnph" src="https://imageproxy.pbkrs.com/https://wpimg-wscn.awtmt.com/e32512da-d7ca-4bdb-b489-4a259020a24a.jpeg?x-oss-process=image/auto-orient,1/interlace,1/resize,w_1440,h_1440/quality,q_95/format,jpg" width="765" height="148" original-src="https://imageproxy.pbkrs.com/https://wpimg-wscn.awtmt.com/e32512da-d7ca-4bdb-b489-4a259020a24a.jpeg"/>
还有一条上千点赞的评论称，值得注意的是，英特尔有 3 纳米的产能，英伟达没有。 因此，如果是势均力敌的竞争，应该对英特尔有利。
<img class="wscnph" src="https://imageproxy.pbkrs.com/https://wpimg-wscn.awtmt.com/608ffc55-3baf-44dd-8523-bc4594b113e4.jpeg?x-oss-process=image/auto-orient,1/interlace,1/resize,w_1440,h_1440/quality,q_95/format,jpg" width="733" height="137" original-src="https://imageproxy.pbkrs.com/https://wpimg-wscn.awtmt.com/608ffc55-3baf-44dd-8523-bc4594b113e4.jpeg"/>

英特尔

英特尔发布了新一代 AI 芯片 Gaudi 3，据称性能优于英伟达竞品 H100。Gaudi 可将 Llama2 和 GPT-3 模型的训练时间缩短 50%，将 Llama 和 Falcon 模型的推理吞吐量提高 50%。英特尔还将与多家企业合作打造企业 AI 的开放平台。

超越英伟达 H100！英特尔推出新一代 AI 芯片 Gaudi 3，大模型训练推理能力强化 50%