
“AI 拉胯” 亞馬遜:會上演逆襲大戲嗎?

OpenAI崛起時,是$微軟(MSFT.US) 的風光無限。Gemini的崛起,$谷歌-A(GOOGL.US) 雲洶湧向前;那麼問題來了:Athropic當下一枝獨秀,哪個雲廠商會受益。
AI上無論是芯片研發、模型研發,還是GPU拿貨都“慢一拍”的$亞馬遜(AMZN.US) 會等到屬於自己的機會嗎?
1、原本“遜爆了”的亞馬遜AWS當下AI的業務佈局如何?
2、亞馬遜和Anthropic之間的合作關係對公司的幫助有多大?該合作關係是否穩固?
3、亞馬遜的自研芯片能力到底如何?
4、亞馬遜最弱的大模型能力達到什麼水平了?
對於以上幾個問題,海豚君來詳細看看:
一、亞馬遜AI要跑起來了?
1、細探AWS的收入構成
26年一季度,亞馬遜的AI年化收入超過$150億,佔AWS總收入的比重達到約10%,而在24年一季度時公司曾模糊的表述過當時AI年化收入體量約小几十億。當前AWS中AI收入約10%的佔比仍明顯低於Azure的超20%,相對仍低。
分析AI收入構成前,先説下AWS的收入細分:
a. IaaS:算力芯片、存儲(硬盤)、連接帶寬等基礎資源,拳頭產品如“EC2”。因是基礎硬件初級虛擬化租賃,利潤率低。
b. PaaS中間層:各類Database,數據分析工具,調度管理工具和安全工具等中間層應用,利潤率更高;
c. SaaS應用層 & 其他業務:自研或或第三方軟件,以及其他業務例如垂類行業解決方案,IoT等。
AWS一直IaaS最多,即使到現在也仍佔60%,PaaS類佔比提升到30%,SaaS仍是個位數比重。
2. 跨層的AI業務
至於三層蛋糕之上的“+1”就是三大板塊中和AI相關收入,單拉出來的口徑。據市場推測,AWS的AI業務具體包括:
a. 主要是算力租賃業務(IaaS類):相比傳統算力租賃的差異是,AI算業務租賃的一般是基於Trainium/Inferentia芯片或英偉達GPU,且客户更加集中於大型AI Lab或科技企業。
由於AI需求的芯片和存儲成本高漲,客户羣體又更加集中、議價權更強。因此,雲廠商們在AI IaaS業務上利潤率很低,比傳統雲低。
b. 第二大部分是Bedrock – AWS旗下的MaaS/TaaS(Token-as-a-service)平台,不直接租硬件,而是亞馬遜部署好大模型後,直接對外出售模型API或Token。
c. 其他還有SageMaker和亞馬遜 Q等。其中SageMaker簡單來説是預部署好的AI/ML訓練、調試和部署平台,方便用户自行訓練或微調AI大模型,以及訓練完成後的調用和推理。
亞馬遜 Q則是直接面向終端用户的AI Agent產品線,可再細分為Developer、Business、Connect等產品,分別面向開發者、企業員工、客服等用户。
這兩項業務和Bedrock一樣,都不直接出租“裸硬件”,通過硬件基礎上附加上一層服務,因而邏輯上會有更高的利潤率。
AWS收入高增,利潤率沒掉鏈子,除Anthropic用量爆發外,核心是因為:
a. AWS AI營收佔比不高,但高利潤MaaS/TaaS佔比多。根據Semi Analysis調研,目前Bedrock貢獻了AWS AI收入約37%,而Azure和GCP的AI收入中的約80%仍是來自IaaS類的純硬件租賃。
b. MaaS/TaaS絕對收入規模上,AWS同樣領先達約$55億,谷歌雲稍低於50億,而Azure則不到20億。而亞馬遜的MaaS/TaaS業務目前的經營利潤率可達55%vs. 1Q26 AWS整體不到38%的經營利潤率。
c. 新雲如甲骨文、CoreWeave等因與新雲們在軟件能力上普遍不強,大多隻能做“裸金屬”租賃這類低附加值且低利潤率的業務。新雲MaaS/TaaS收入合計相比三大雲廠商基本忽略。
二、和AI Lab合作關係也是關鍵競爭力
以上我們從AI能力三大支柱能力之一--算力的角度,簡要探討了亞馬遜AI業務的具體構成,以及當前MaaS/TaaS正成為雲業務的主要發力方向。
而海豚君認為,MaaS/TaaS業務的主要競爭力在於兩點:一是平台能提供的模型深度(有沒有當前最強SOTA級模型)和廣度(可選擇的模型數量、類型、層級多不多);二就是提供類似模型時,成本和定價能不能比其他雲廠商有優勢。
而這第一點對應的是雲廠商自研模型或是和第三方模型公司建立良好合作的能力;第二點則主要對應雲廠商們通過自研芯片或優秀工程能力降低單位算力成本的能力。
亞馬遜一直強調平台模式,對大模型研發投入度不夠,自研Nova模型目前能力僅大約相當於Haiku 4.5 到 Sonnet 4.5水平,因此亞馬遜相當依賴於外部AI Lab來其補強AI模型能力。
實際上,前文提到的Bedrock業務銷售的API/Token絕大部分是基於第三方模型,目前以Claude為主,在公司和OpenAI建立深度合作後,後續GPT模型API/Token數量想必也會明顯提升。
因此,我們接下來就詳細探討下亞馬遜和Anthropic這家頭部AI Lab的合作關係:
1、與Anthropic的合作
亞馬遜首個深度合作的AI Lab是Anthropic,最早的“合作跡象”可追溯回23年4月時Claude模型上架Bedrock,正式官宣合作則在23年的9月。概括來看,兩者之間和合作關係發展可大致分為三個階段:
a. 23年9月:首輪合作亞馬遜對Anthropic注資40億美元(分三次到24年5月全部完成),相應的Anthropic決定以AWS為首要雲服務提供商,將在訓練和推理中更多使用Trainium和Inferentia芯片(根據新聞報道,此前可能主要使用TPU和Nvidia GPU),並在Bedrock上全面向商業用户提供Claude模型。
b. 24年11月: 這輪合作中,亞馬遜對Anthropic再注資$40億、累計80億。同時,雙方的合作深入到了芯片設計和模型的共同一體化研發。包括硬件上,Anthropic直接與Annapurna Labs(亞馬遜旗下芯片研發部門)合作開發設計Trainium等芯片;軟件上,Claude模型的底層內核也專門針對Trainium芯片和指令站進行優化。
這一階段內,兩家公司合作的Project Rainier--主要基於Trn芯片的超大規模算力中心項目也首度得到官宣。(後文會再單獨詳細討論該項目)
c. 26年4月: 亞馬遜進一步對Anthropic注資$50億,累計達$130億,並擁有最高達$200億的額外投資權。
Anthropic承諾十年內在AWS上花費超過$1000億,並使用5GW的Trainium芯片,包括已投產的Trn2和後續的Trn3 & Trn4。
這裏有意思的一點是,目前公允的1GW算力對應的年收入額普遍略高於$100億,而該1000億對應5GW的合約中,隱含的每GW Trn芯片算力產生的年雲收入明顯偏低。
雖然部分原因是算力爬坡需要時間並非從Day1就會用滿5GW算力,並且Anthropic也每表示除了5GW 的Trn芯片外,不通過AWS租用基於其他芯片的算力,但多少側面體現出Trn芯片的綜合使用成本應當明顯低於基於英偉達GPU的成本。
2、Anthropic對AWS收入的貢獻?
那麼作為亞馬遜的AI戰略上最重要的合作伙伴,Anthropic實際給AWS貢獻的營收規模有多大?
這包括兩個部分,主要部分是Anthropic自身花費在AWS上的訓練和推理費用,另一部分則是AWS通過Bedrock代銷Anthropic模型API/Token產生的分佣收入。
a. 海豚君根據新聞報道中的數據進行粗略測算,24年、25年和26年1季度內,Anthropic的算力支出大約佔AWS當期收入的約1%、3%和8~9%。雖然絕對佔比不高,但以今年1季度為例,Anthropic直接貢獻的收入佔AWS AI收入的比重能達80%或更高。
b. 而AWS通過Bedrock分銷Claude模型產生收入,該模式下Bedrock定位是分發平台,Anthropic自身才是銷售主體,因此全部銷售額會記為Anthropic的收入。AWS從中直接獲得的收入,是基於銷售額一定比例的渠道佣金。
因而,MaaS業務貢獻的絕對收入規模會較小,但也因佣金性收入的邊際成本非常低,利潤率會明顯更高。整體來看,可以説當前AWS AI收入的絕大部分都是由Anthropic直接或間接貢獻的,因此Anthropic後續ARR的增長勢頭也對AWS的增長提速有很強的指引作用。
(需要注意,當客户在Bedrock上購買Claude模型的API/Token時,其底層的調用的算力硬件大概率也是由AWS供應,因而也會給AWS帶來硬件出租收入,但這部分是作為Anthropic在AWS上花費的推理算力支出計入IaaS收入)
c. 目前看,亞馬遜和Anthropic沒有類似微軟和OpenAI基於股權關係的收益分配。
d. 整體來看,當前AWS AI收入的絕大部分都是由Anthropic直接或間接貢獻的,因此Anthropic後續ARR的增長勢頭也對AWS的增長提速有很強的指引作用。
做一個簡單測算,Anthropic的ARR在3、4月達峯後,5月的環比增速有所放緩。截至5月其ARR大約為$450億,保守假設按後續每月的環比增量平穩下降,到26年Anthropic底達約700億出頭。
則在簡化假設後續AWS所有AI收入都來自Anthropic,且AWS非AI收入在26年增長約16%(去年約14.4%)的情況下。則26年全年Anthropic可能會貢獻AWS約19%的總收入,帶動AWS在26年的總收入增速達到35%以上,相比一季度是約28%的增速。和我們此前在模型中預估的全年增速大體相當。
此外,微軟曾一度因和OpenAI的緊密合作,業績強勢上揚。但之後也因和OpenAI關係的漸漸疏離,呈現頹勢。模型和模型分銷商之間強共振。
亞馬遜和Anthropic之間會不會復刻微軟的“老路”?海豚君看下來,感覺應該不會。
首先雖然兩個CSP都是兩個頂模的早期投資人,而且投資金額也都類似,但關鍵區別是:
a. 微軟 & OpenAI的股權綁定更深:據推測亞馬遜對Anthropic僅持有約個位數%的少數份額,在後者的管委會中也沒有席位。
因此,海豚君認為微軟和OpenAI之間的合作很大程度上建立在更高的股權關係綁定上, 這一點從微軟能夠直接從OpenAI的收入中直接分成,且之前對API有獨家分銷權。亞馬遜卻只能從與Anthropic的正常商業交易中獲得收益,也有體現。
b. 合作開放,但亞技術綁定深:我們認為亞馬遜和Anthropic之間的合作關係,更多建立在兩家公司之間的技術。
Anthropic的模型訓練大量使用了亞馬遜獨有的Trainium等芯片,且Anthropic模型的底層代碼和亞馬遜的ASIC芯片相互之間都做了專門的深度適配。
因此,Anthropic不能“無痛”脱離亞馬遜,有比較高的遷移成本。而由於微軟在自研芯片上的能力不足,GPT模型主要基於英偉達的硬件生態,OpenAI因此對微軟沒那麼依賴。
3、Project Rainier 能告訴我們什麼?
這一章節的最後,在簡要聊一下Project Rainier,如前文提到的這是AWS為了滿足Anthropic訓練和推理需求,建設的基於亞馬遜自研芯片的超大算力中心。根據公司已宣佈的建設計劃,該項目前包括2個營址(Campus)-- Campus New Carlisle 和 Campus Northern Indiana,具體來看:
a. New Carlisle是首個項目,計劃總投入110億美金,總算力規模在2.2~2.3GW。於24年9月開始建設,25年10月底首次投入運營(當時上線規模大約為50萬顆Trn2)。據Well Fargo的預測,26年初該項目一期(Phase 1)完全上線,總規模大約1.3GW,據測算對應約170萬顆Trn2。
隨着Trainium 3代芯片計劃於26年中開始量產,後續Rainier項目中將同時部署Trn 2代和3代芯片,並且預計將再新增約0.9~1GW的產能(預計大部分將在26年內建設完畢)。
b. Northern Indiana項目在25年末宣佈,預計總算力規模約2.4GW,計劃投資額$150億,目前對該項目的信息較少,但有新聞報道在5月開始該項目已進入建設階段。
根據以上信息,可以初步得出以下幾個值得關注之處:
a. 目前Project Rainier已宣佈的合計產能約4.6~4.7GW,且主要基於Trainium芯片建設,這和Anthropic在4月合作協議中宣佈將總共使用約5GW Trn芯片的規模基本對應。
因此該項目的建設節奏可以視為亞馬遜和Anthropic兩者之間合作關係的風向標。
b. 亞馬遜 從零到建設完成約1GW+算力中心需要的時間大約在15~16個月,該建設速度和同行Oracle的速度大體相當(Abiliene Phase 2 約1GW,預計15個月完成)。
c. 按公司披露的投資額,Rainier兩個項目對應的單GW計劃投資額僅$50~60億左右,遠低於英偉達聲稱的每GW對應500億投資額的框架。當然公司並未明確$110億和$150億投資額覆蓋的範圍--是隻包括數據中心廠房和基礎設備,還是包含了芯片、服務器等全部設備。(按常識應該不太可能是完整的花費額)
因此,雖不能簡單推斷Trn芯片的單GW建設成本只有基於英偉達GPU的1/10,但定性推斷Trn芯片的單GW綜合建設成本比英偉達GPU低不少應當問題不大。
d. 從Anthropic宣佈的10年$1000億的雲計算支出,對應5GW Trn芯片,隱含單GW收入明顯低於目前行業內每GW對應約100億收入的普遍水平。
參考外行的測算(測算與25年底,因此不可能是通過4月宣佈的合作金額來倒推),Trainier New Carlisle項目2.2 GW產生的實際年收入(折扣後)大約在140億,即基於Trn芯片的每GW算力產生收入大約只有目前行業均值的60%~65%。
綜合以上兩點,可以側面表明Trn芯片對運營方而言建設成本,和對用户的使用成本應當都明顯低於當前基於英偉達芯片的平均水平。
但也需要強調,Project Rainier目前主要使用的Trn2和Trn3代芯片的絕對性能,前者大致只有H200的約60%,後者略微超過。因此定價要低也合乎情理。
二、亞馬遜的ASIC芯片實力如何?
雲算力、芯片和大模型是AI綜合能力的三個主要評判標準,而亞馬遜的自研芯片是其能深度綁定Anthropic,並在雲業務上建立成本優勢的關鍵因素。因而這一部分我們來探討公司的芯片業務佈局。
2.1、亞馬遜自研芯片類型和時間線
亞馬遜的芯片自研史,開始於2015年初收購芯片設計公司Annapurna Labs,且可大致歸類為4條並行的研發路線 – Nitro(專用控制系統和存儲),Graviton(基於ARM架構的通用CPU),Inferentia(推理向ASIC芯片) 和 Trainium(訓練&推理全能向ASIC),具體來看:
1)Nitro / Nitro SSD:是公司自研的第一條硬件產品線,17年就推出首代。Nitro系列不直接供客户租用常規計算芯片,而是專用於內部管控的控制硬件系統,將包括虛擬化,網絡、存儲、等資源分配,任務管、安全管控等職能,交由獨立的硬件模塊控制,起提升運行效率從而優化成本結構的作用。
2)Graviton:基於ARM架構的通用型CPU,最早一代發佈於18年,早期以低價格/高能效比為特色,主要負責相對低負載任務。
而經過多輪迭代後,目前第5代(25年底推出,預計26年中開始大規模商用)已和同代x86架構主流CPU性能不再有巨大差異。
因此,Graviton目前已大量提供給外部用户租用,且大概率是目前亞馬遜使用量最大的自研芯片。
3)Inferentia:主要用於傳統AI/ML(machining learning)的專用推理ASIC,首代發佈於18年底,當時是主要用於如搜索排序、個性化推薦、圖片/語音識別等較為基礎的ML功能。
隨後轉型為LLM的推理芯片,但因推理對芯片性能的要求也“水漲船高”,且Trn芯片也可以用於推理,因此目前其定位已部分被Trainium取代,在22年底公佈2代後至今無新產品發佈。
4)Trainium:進入LLM時代後,目前亞馬遜最重要的自研芯片產品線,首代發佈於2020年(實際應用於22年),最早的目的也是用於訓練傳統ML模型。
但隨着GenAI LLM模型成為AI的主流路徑,在經過5年3代的迭代後(4代正在研發中),已成為主要用於AI模型的訓練和推理的芯片,對標Nvidia GPU和Google TPU。
小結來看,由於Nitro主要是用於內部使用,而Inferentia的推理芯片定位已部分被取代,目前值得關注的主要就在Trainium 和 Graviton,後文我們的重點也就放在這兩條產品線。
2.2、性能比較
概況性的講,公司自研芯片的核心底層原因主要是--降低對外部硬件供應商的依賴,憑藉從底層硬件到頂層軟件一體化自研的方法,提高硬件的能效/成本比,進而最終體現為公司雲業務利潤率的釋放。
因此性能/性價比的比對,最好的情況也是不只看單芯片能力,而是基於包含芯片、存儲、網絡連接、軟件一套完整系統,以便更真實的體現不同芯片生態和不同雲廠商的真實能力。因此,以下對Graviton芯片性能和參數的比較都是基於AWS內真實提供的實例。
1)Graviton芯片性價比很能打
看紙面參數,下表中列出了基於Graviton各代芯片和其對標的同樣CPU在AWS內實例的規格。其中Max CPU數反映最大並行計算的能力,Network bandwidth反映實例和外部的連接速度,EBS bandwidth反映計算實例和存儲之間的連接速度。
由於AWS對同一芯片有大量不同型號的實體(各有能力特化),我們統一選取“M型號”(通用版本)下的最大CPU數實例,可見Graviton 5實例的紙面參數大致和已量產的最新的Intel Xeon 6和AMD EPYC 5th旗艦型號CPU相差不大。
但Graviton 5是25年底推出,26年中量產,而其對標的兩款CPU芯片則都是24年的產品,下一代也已在研發中。綜合來看Graviton大約還落後AMD和Intel約一代產品。(實際上從AWS的型號命名也可看出)
另外值得注意,Graviton實例的連接能力更強,如通用版本中Graviton 5強於EPYC 5代。而若都看連接能力特化版本,以Graviton 4為例,其特化版的Network和EBS最大帶寬分別高達600Gpbs和300Gbps,相比之下其對標EPYC 4代的最大帶寬分別只有300Gbps和50Gbps(Intel的更低)。
至於實際性能的比較,雖然Graviton 5因尚未大規模商用,沒有實際性能測試,但OpenBenchMarking上有對Graviton4,AMD EPIC 9R14和Intel Xeon 8488 三種芯片同型號實例的多種測試,可以看到:
a. Gravtion的平均性能得分和Xeon 8848c大致相同,大約是EYPC 9R14的80%。
b. 按測試當時(24年底)各實例的定價,每美元對應性能Graviton4位列第一,比EYPC略高3.4%,比Intel Xeon 高出近18%。
由以上基於4代的性能/能效比測試可見,雖然Graviton芯片在絕對性能上相比同代最強的AMD CPU仍有一定差距,但在AWS環境下能實現比對標的上代旗艦CPU芯片更高的投入產出比,足以吸引部分更追求投入產出比的用户使用Graviton來替代傳統CPU。
2)Trainium4 潛力可觀?
對於Trainium芯片,由於其基本只以UltraServers/Clusters、即大規模集羣的形式向大客户提供,公網上對Trainium芯片的真實性能測試(尤其是3代和4代)相當少,只能主要以官方提供的參數和性能評價作為參考。
首先在單芯能力上,可見:
a. 目前已開始量產的Trainium3的理論性能(計算頻率和內存帶寬),只剛剛超過Nvidia H200(發佈於23年底)。但仍明顯弱於Google TPU v7(發佈於25年中旬),以FP8計算頻率為例,Trn3的只有TPU v7的約55%。
至於已大規模使用的Trn2代芯片的紙面性能則更只有Trn3的50%~60%,顯然仍不具備多強的競爭力,更多隻能適配於推理計算,或非旗艦級模型的訓練;
b. 不過按公司披露的性能目標,正研發中的Trainium4的理論性能將直接超過TPU v8系列和Nvidia B300系列,僅在FP4計算精度下的計算速度次於英偉達最新Rubin架構下的R100系列。
也就是説,Trainium 4的理論性能若實際落地,將跨越式達到行業內的領先水平,足以吸引頭部AI Lab等大型客户採用Trn4芯片來進行旗艦型模型的訓練與推理,有希望進一步顯著推動AWS收入的增長。
當然也需要注意以上性能目前只存在於紙面,目前Trn4還沒有明確的流片時間。
三、自研模型已起步,還有很大差距要彌補
本文的最後,我們簡要過一下目前亞馬遜在AI能力三支柱上最弱的一環--即大模型能力。亞馬遜實際也已推出了自研的大模型Nova,能力確實較差,比行業SOTA水平差了1~2個大版本,概括來看有一下幾個關注點:
a. 發佈時間晚、更新節奏不快:Nova首代版本發佈於24年12月,直到到25年底才更新了Nova2代。可見亞馬遜自研大模型的起步確實較晚,且更新迭代的節奏相對較慢。
b. 多模態路線:可以看到,Nova的研發路線並非追求專精(如選擇文字或Coding某一能力死磕到SOTA級別),而是選擇了多版本、多模態路線。在主版本之外,還有Omni版本能支持文字、圖片、視頻處理能力,有Sonic版本支持語音處理。
c. 絕對性能不強,但反應迅速:模型的具體能力上,根據亞馬遜提供的基於MMLU-Pro等指標的跑分數據,Nova2 Lite的能力大致相當於Gemini 2.5 Flash或 Haiku 4.5,而Nova 2 Pro的能力,則和Gemini 2.5 Pro或Sonnet 4.5互有勝負。
可見Nova 2的能力確實不強,最新的旗艦模型只相當於頭部AI Lab上一代版本的中游模型的能力,但也確實在OCR和RealKIE這兩個體現對圖片和結構化文檔識別能力的指標上表現更好。
另一個亞馬遜突出強調的Nova優勢在其有更高的相應速度,在輸出首個Token所需時間和平均每秒輸出Token量,這兩個指標上Nova 2 Lite和Pro都明顯快於其對標模型。
d. 基於Nova目前的多模態路線和能力,海豚君認為Nova目前應當更多是用於企業內部的提效,用來快速處理相對簡單且重複的任務(如合同、發票識別處理、電商內的圖片搜索、AI客服等)。
換言之,亞馬遜的自營模型目前對拉動營收增長的作用應當很有限,但可能體現在成本、費用的壓縮上。
小結:當前亞馬遜在雲業務上的綜合實力有從落後者重回領跑的跡象,其在MaaS業務上的領先是最大亮點;在芯片能力上,亞馬遜實際也有完善的產品線佈局。雖目前按已發佈的版本性能,相比Google TPU仍有一定差距,但正在快速解決。
大模型能力上,雖然仍差距明顯,但憑藉和Anthropic的深度合作,在中期內算是能起到曲線救國的作用。
因此,亞馬遜的AI綜合實力其實並不算很弱。後續,海豚君將繼續梳理、探討其他雲公司的AI能力和佈局,並在最後嘗試給出一個行業性的整體判斷和具體公司偏好,盡請期待。
<全文結束>
海豚研究過往【亞馬遜】研究:
深度研究
2024年12月18日《亞馬遜電商終局猜想:零售的馬甲,廣告的魂?》
財報點評
2026年4月30日電話會《亞馬遜(紀要):AI 一生一次的投資機會》
2026年4月30日財報點評《零售穩盤、AI 破局,亞馬遜重回第一梯隊?》
2026年2月6日財報點評《2000 億軍備賽!亞馬遜為 AI 顛出新高度》
2026年2月6日財報點評《亞馬遜(紀要):所有新增產能都被用户立刻消化》
2025年10月30日電話會《亞馬遜(紀要):到 2027 年算力供給再翻倍》
2025年10月30日財報點評《AWS 大反轉,亞馬遜終於 “苦盡甘來” 了?》
本文的風險披露與聲明:海豚研究免責聲明及一般披露
本文版權歸屬原作者/機構所有。
當前內容僅代表作者觀點,與本平台立場無關。內容僅供投資者參考,亦不構成任何投資建議。如對本平台提供的內容服務有任何疑問或建議,請聯絡我們。

