AWS CEO:亞馬遜如何在 AI 時代逆襲?以超大規模交付更便宜、更可靠的 AI

華爾街見聞
2025.12.03 01:38
portai
我是 PortAI,我可以總結文章信息。

AWS AI 工廠為客户提供兩種技術路線選擇,客户可以選擇 Nvidia-AWS AI 工廠集成方案,同時 AWS 提供基於自研 Trainium 芯片的方案。通過提供靈活的部署方式和更具成本效益的專用基礎設施,亞馬遜開始爭奪對數據主權和合規性要求嚴格的高價值客户,例如政府機構和大型組織。

亞馬遜雲服務 (AWS) 正通過將 AI 基礎設施直接部署到客户數據中心的方式重塑雲計算市場格局。這一名為"AI 工廠"的新產品模式使政府和大型企業能夠在滿足合規要求的前提下大規模部署 AI 項目,同時保持對數據處理和存儲位置的完全控制。

週二,AWS 在拉斯維加斯舉行的 Re:Invent 2025 大會上發佈了這一產品。AI 工廠將 Nvidia GPU、Trainium 芯片以及 AWS 網絡、存儲和數據庫等基礎設施部署到客户自有數據中心,專門為單一客户運營,像私有 AWS 區域一樣運作。

該產品基於 AWS 為 Anthropic 打造的 Project Rainier 項目發展而來,並已在沙特阿拉伯與 Humain 的合作中得到應用。上個月,AWS 與 Humain 宣佈擴大合作,計劃部署約 15 萬顆 AI 芯片,包括 Nvidia GB300 和 Trainium 芯片。

這一模式反映了雲服務商在 AI 時代的戰略轉變:通過提供靈活的部署方式和更具成本效益的專用基礎設施,爭奪對數據主權和合規性要求嚴格的高價值客户。

雙芯片戰略滿足不同需求

AWS AI 工廠為客户提供兩種技術路線選擇。客户可以選擇 Nvidia-AWS AI 工廠集成方案,獲得 Nvidia 硬件、全棧 Nvidia AI 軟件以及 Nvidia 計算平台。AWS Nitro 系統、Elastic Fabric Adapter(EFA) 千萬億級網絡以及 Amazon EC2 UltraClusters 支持 Nvidia Grace Blackwell 和下一代 Nvidia Vera Rubin 平台。

同時,AWS 提供基於自研 Trainium 芯片的方案。公司在 Re:Invent 大會上發佈了 Trainium3 UltraServers,並公佈了 Trainium4 芯片的規劃細節。值得注意的是,AWS 計劃讓未來的 Trainium4 芯片兼容 Nvidia NVLink Fusion,增強兩種方案間的互操作性。

Nvidia 負責超大規模和 HPC 業務的副總裁兼總經理 Ian Buck 表示:

大規模 AI 需要全棧方法——從先進的 GPU 和網絡到優化數據中心每一層的軟件和服務。通過將 Nvidia 最新的 Grace Blackwell 和 Vera Rubin 架構與 AWS 安全、高性能的基礎設施和 AI 軟件棧相結合,AWS AI 工廠讓組織能夠在極短時間內建立強大的 AI 能力,完全專注於創新而非集成。

沙特項目驗證商業模式

沙特阿拉伯的 Humain 項目為 AWS AI 工廠模式提供了大規模商業化驗證。Humain CEO Tareq Amin 表示:"AWS 在我們新 AI 區建設的 AI 工廠代表了 Humain 和 AWS 數千兆瓦級旅程的開端。從一開始,這一基礎設施就是為滿足日益增長的本地和全球 AI 計算需求而設計的。"

Tareq Amin 強調選擇 AWS 的原因:"我們選擇 AWS 是因為他們在大規模構建基礎設施方面的經驗、企業級可靠性、廣泛的 AI 能力以及對該地區的深度承諾。通過對全球市場擴張的共同承諾,我們正在創建一個將塑造 AI 理念如何為整個世界構建、部署和擴展的生態系統。"

該項目涉及部署約 15 萬顆 AI 芯片,包括 Nvidia GB300 和 Trainium 芯片,展示了 AWS 在超大規模 AI 基礎設施交付方面的能力。

瞄準政府和高合規需求市場

AI 工廠產品主要針對對數據主權和合規性有嚴格要求的政府機構和大型組織。這種專用基礎設施模式使客户能夠在自有數據中心內運行 AWS 託管服務,包括基礎模型,同時保持對數據處理和存儲位置的控制。

這一定位與 AWS 近期的市場動作相呼應。據媒體報道,AWS 最近宣佈計劃投資 500 億美元為美國政府擴展 AI 和高性能計算能力。

通過 AI 工廠模式,AWS 將雲服務的靈活性與本地部署的合規性相結合,為客户提供了第三種選擇。這種"私有 AWS 區域"的運作方式讓組織能夠利用 AWS 的管理服務和技術能力,同時滿足監管機構對數據本地化和主權的要求。