--- title: "英伟达与 AWS 合作以实现 AI 的大规模生产应用" type: "News" locale: "zh-CN" url: "https://longbridge.com/zh-CN/news/290621271.md" description: "NVIDIA 与 AWS 合作以扩大 AI 生产。AWS EC2 G7 实例配备 NVIDIA RTX PRO 4500 Blackwell GPU,提供高达 4.6 倍的 AI 推理性能。NVIDIA cuVS 使 GPU 加速的向量搜索成为 Amazon OpenSearch Serverless 的默认选项,速度提升 10 倍且成本更低。此外,AWS 获得了 NVIDIA Exemplar Cloud 认证,适用于 GB300 训练工作负载,确保大型 AI 项目的高性能基础设施" datetime: "2026-06-24T00:15:49.000Z" locales: - [zh-CN](https://longbridge.com/zh-CN/news/290621271.md) - [en](https://longbridge.com/en/news/290621271.md) - [zh-HK](https://longbridge.com/zh-HK/news/290621271.md) --- # 英伟达与 AWS 合作以实现 AI 的大规模生产应用 大规模构建人工智能系统是一个挑战,需要低延迟推理、快速向量搜索、强大的 GPU 性价比以及能够在不增加运营复杂性的情况下扩展的基础设施。 NVIDIA 与亚马逊网络服务(AWS)的最新合作解决了这些限制。在亚马逊 OpenSearch 和亚马逊 EC2 上,NVIDIA AI 基础设施为企业提供了更实用的路径,以在生产规模上部署人工智能。 由 NVIDIA RTX PRO 4500 Blackwell Server Edition GPU 驱动的 EC2 G7 实例扩展了人工智能、图形、视频和数据分析工作负载的计算层,而 NVIDIA cuVS 库通过使 GPU 驱动的向量索引成为 OpenSearch Serverless 中的默认选项,加速了检索层。随着 AWS 获得 NVIDIA GB300 的 NVIDIA Exemplar Cloud 状态,客户可以信任他们获得了针对训练工作负载的最佳优化性能。 ## **NVIDIA RTX PRO 4500 Blackwell Server Edition 多工作负载 GPU 为新的亚马逊 EC2 G7 实例提供动力** 亚马逊 EC2 G7 实例将 NVIDIA RTX PRO 4500 Blackwell Server Edition GPU 引入 AWS,用于人工智能推理、图形、空间计算和 GPU 加速的数据分析——提供了一种为需要性能而不增加客户管理 GPU 平台运营开销的生产工作负载而设计的新实例类型。 与 G6 实例相比,G7 在人工智能推理性能上提升了最多 4.6 倍,在图形性能上提升了最多 2.1 倍,并且在使用 NVIDIA cuDF 库进行 Apache Spark 工作负载的亚马逊 EMR 上,GPU 加速的数据分析速度显著更快。 支持最多八个 GPU、256GB 的总 GPU 内存、700 Gbps 的 EFA 启用网络和最多 7.6TB 的本地 NVMe SSD 存储——涵盖一、二、四和八个 GPU 配置以及即将推出的裸金属,G7 实例让客户能够根据工作负载合理配置基础设施,而不是过度配置。 该平台的多功能性意味着人工智能团队可以获得更低延迟的推理。媒体和娱乐团队可以获得高分辨率的视频工作流程和渲染。仿真、计算机辅助设计、虚拟桌面基础设施、游戏和空间计算团队可以为图形密集型应用使用相同的实例类型。数据团队可以将 GPU 内存、本地存储和网络改进应用于分析管道和向量数据库工作负载。 G7 实例可以通过 AWS 深度学习亚马逊机器镜像(AMIs)、亚马逊深度学习容器、亚马逊 EMR、亚马逊 EKS、亚马逊 ECS 和图形 AMIs 访问——并且即将推出亚马逊 SageMaker AI。 ## **NVIDIA cuVS 使 GPU 加速的向量搜索成为亚马逊 OpenSearch 中的默认选项** 下一代亚马逊 OpenSearch Serverless 为自主人工智能和动态工作负载提供动力,无需基础设施管理。它使用由 NVIDIA cuVS 驱动的 GPU 加速向量索引,作为所有向量集合的默认计算选择。 对于构建检索增强生成、语义搜索、推荐系统和自主人工智能应用的团队来说,这一转变至关重要。它将 GPU 驱动的向量搜索从一个专业的优化项目转变为标准的 AWS 能力。 客户的影响是直接的:向量索引速度提高至 10 倍,成本仅为 CPU 构建的四分之一——使得在不到一个小时内构建十亿规模的向量数据库成为可能。 通过将 NVIDIA cuVS 设为 OpenSearch Serverless 中的默认选项,AWS 客户可以更快地从原始数据转向生产就绪的人工智能检索基础设施——具有无服务器扩展,减少了工作负载闲置时的运营开销。 ## **AWS 获得 NVIDIA GB300 训练性能的 NVIDIA Exemplar Cloud 状态** AWS 在 NVIDIA GB300 上获得了 NVIDIA Exemplar Cloud 状态,适用于训练工作负载。这意味着 AWS 满足了 NVIDIA 用于基准人工智能工作负载的严格性能标准。 这一成就得益于 AWS 和 NVIDIA 团队之间的深入共同工程努力。通过 NVIDIA Exemplar Clouds 计划,开发人员和人工智能领导者可以确信他们正在使用一致的高性能云基础设施进行大规模训练,帮助团队更有信心地评估云服务提供商,改善总体拥有成本,并更高效地将人工智能项目从规划转向生产。 这些进展共同加强了 AWS 上人工智能基础设施堆栈的每一层。贯穿始终的是:在不增加运营负担的情况下,提供生产级人工智能基础设施,能够在规模上运行。 _在_ _这篇 AWS 博客_ _中了解更多信息_. ### 相关股票 - [NVDA.US](https://longbridge.com/zh-CN/quote/NVDA.US.md) - [NVDD.US](https://longbridge.com/zh-CN/quote/NVDD.US.md) - [07388.HK](https://longbridge.com/zh-CN/quote/07388.HK.md) - [NVDY.US](https://longbridge.com/zh-CN/quote/NVDY.US.md) - [07788.HK](https://longbridge.com/zh-CN/quote/07788.HK.md) - [NVDX.US](https://longbridge.com/zh-CN/quote/NVDX.US.md) - [NVDQ.US](https://longbridge.com/zh-CN/quote/NVDQ.US.md) - [NVDB.US](https://longbridge.com/zh-CN/quote/NVDB.US.md) - [NVDL.US](https://longbridge.com/zh-CN/quote/NVDL.US.md) - [NVDU.US](https://longbridge.com/zh-CN/quote/NVDU.US.md) - [NVDS.US](https://longbridge.com/zh-CN/quote/NVDS.US.md) - [NVD.US](https://longbridge.com/zh-CN/quote/NVD.US.md) - [NVDG.US](https://longbridge.com/zh-CN/quote/NVDG.US.md) - [NVDO.US](https://longbridge.com/zh-CN/quote/NVDO.US.md) - [NVDW.US](https://longbridge.com/zh-CN/quote/NVDW.US.md) - [NVYY.US](https://longbridge.com/zh-CN/quote/NVYY.US.md) - [NYYY.US](https://longbridge.com/zh-CN/quote/NYYY.US.md) - [DIPS.US](https://longbridge.com/zh-CN/quote/DIPS.US.md) - [09388.HK](https://longbridge.com/zh-CN/quote/09388.HK.md) - [MAGX.US](https://longbridge.com/zh-CN/quote/MAGX.US.md) - [AMZN.US](https://longbridge.com/zh-CN/quote/AMZN.US.md) - [NVD.DE](https://longbridge.com/zh-CN/quote/NVD.DE.md) ## 相关资讯与研究 - [AI 基建烧钱这么快,到底能不能回本?](https://longbridge.com/zh-CN/news/290435794.md) - [“英伟达挑战者” Cerebras 上市后首份财报来袭!Wedbush 力挺:任何拐点都将是积极信号](https://longbridge.com/zh-CN/news/290522914.md) - [GPU 租赁价短期承压、交付周期拉长至 15 个月,英伟达是否被市场严重误读了?](https://longbridge.com/zh-CN/news/290497987.md) - [AI 泡沫第一批受害者,是程序员](https://longbridge.com/zh-CN/news/290490467.md) - [AI 基础设施争夺战升温:高通洽谈 40 亿美元收购 AI 芯片企业 Modular](https://longbridge.com/zh-CN/news/290525622.md)