
阿里云的新系统将 Nvidia GPU 的使用量减少了 82%,正值特朗普在对华 AI 芯片禁令上的反复态度之际

阿里云推出了 Aegaeon,这是一种新的计算池系统,可以将 AI 模型对 Nvidia GPU 的使用减少 82%。经过三个月的测试,它将所需的 Nvidia H20 GPU 数量从 1,192 个减少到 213 个,适用于参数高达 720 亿的模型。这项创新旨在通过允许单个 GPU 支持多个模型来提高效率,从而解决资源使用不当的问题。该开发是在对 Nvidia 在中国的市场存在及美国政策对其市场份额影响的担忧中进行的
阿里巴巴集团(NYSE:BABA)推出了一种新的计算池系统,名为 Aegaeon,该系统显著减少了对 英伟达(NASDAQ:NVDA)GPU 的依赖,降低幅度达到 82%。
三个月的测试
根据本周在韩国首尔举行的第 31 届操作系统原理研讨会(SOSP)上发布的一篇研究论文,这项创新在阿里巴巴云的模型市场上进行了超过三个月的测试。
Aegaeon 系统成功地将所需的英伟达 H20 GPU 数量从 1,192 减少到仅 213 个,以支持高达 720 亿参数的模型。
研究人员在论文中表示:"Aegaeon 是首个揭示市场上并发 LLM 工作负载所带来的过高成本的研究。"
来自 北京大学 和阿里巴巴云的研究人员强调了并发大型语言模型工作负载所带来的高成本。
一个 GPU 支持多个模型
阿里巴巴云,作为总部位于杭州的阿里巴巴的人工智能和云服务部门,旨在通过整合 GPU 资源来提高效率,使单个 GPU 能够支持多个模型。
该系统解决了资源低效的问题,因为之前在阿里巴巴云的市场中,17.7% 的 GPU 仅用于处理 1.35% 的请求。
像阿里巴巴云和 字节跳动 的火山引擎这样的云服务提供商同时管理数千个 AI 模型,这往往导致效率低下。Aegaeon 系统旨在通过减少所需的 GPU 数量来优化这一过程。
对英伟达在中国存在的担忧加剧
这一发展是在对英伟达在中国存在的担忧加剧的背景下发生的。最近,中国对英伟达的 H20 芯片提出了安全担忧,特别是关于潜在的后门风险。作为与英伟达达成协议的一部分,特朗普政府与该公司达成了一项 15% 的收入分成协议,涉及其对中国的芯片销售。
英伟达首席执行官 黄仁勋 表示,英伟达在中国的市场份额已从 95% 骤降至零。他对美国政策对英伟达在中国市场存在的影响表示担忧。
尽管面临这些挑战,英伟达已在财务上为潜在的升级做好了防护,因为其指导假设来自中国的收入为零,黄仁勋表示。
- 埃隆·马斯克表示,维持火星殖民地需要 10 万人和 100 万吨货物,重申星际飞船的重要性:‘将人类送上火星’
图片来源:Shutterstock

