硬件軟件齊發力,AMD 正在努力趕超英偉達,目前正面臨生態壟斷的關鍵問題。9 月底,Lamini 聯合創始人兼首席執行官 Sharon Zhou 在 X 平台發佈了一條推文,推文表示在過去的一年裏,她一直在使用 AMD(超威半導體)的 100 多個芯片來為其人工智能初創公司的產品提供支持。這條推文再度引發了市場興奮。為了追趕英偉達,AMD 今年以來動作頻頻,過去兩週以來,AMD 股價累計上漲了約 10%。今年 6 月,AMD 在其新品發佈會上發佈最新 GPU Instinct MI300,並稱 MI300X 提供的 HBM 密度最高是英偉達 AI 芯片 H100 的 2.4 倍,其 HBM 帶寬最高是 H100 的 1.6 倍。這意味着,AMD 的芯片可以運行比英偉達芯片更大的模型,將於今年晚些時候發佈的 Instinct MI300XA 也因此被視為英偉達 H100 的有力競品。但是在軟件方面,英偉達的 Cuda 生態圈將 AMD 芯片拒之門外,想要打破英偉達的壟斷並非易事。AMD 的軟件難題:跨越 Cuda 生態壁壘從硬件參數上來看,AMD Instinct MI300A 已經趕上甚至趕超了英偉達 H100 的水準,剩下的難題就是完善軟件生態,主要是需要兼容英偉達自研的 Cuda 生態。英偉達的 Cuda 軟件及其芯片形成封閉的生態圈,使得 AMD 的 RocM 軟件難以流行。此外,英偉達在其他軟件組件(例如連接操作系統和硬件的驅動程序)方面也擁有巨大的領先優勢。Zhou 在接受採訪時表示,儘管其初創公司成立時間不過一年,但她的聯合創始人 Greg Diamos 已經花費了多年的時間致力於針對 Lamini 開發的軟件優化 AMD 芯片。因此,如果一家初創公司的 AI 應用搭載的是英偉達芯片,那麼它基本上不可能轉向 AMD 芯片,因為這意味着公司必須 “扔掉所有代碼並從頭開始”。為了更明確地表達跨越生態的難度,Zhou 指出,英偉達在 Cuda 生態方面擁有 “兩個十年的領先優勢”。但這不意味着 AMD 的芯片沒有任何優勢。首先,AMD MI300A 芯片率先實現了 CPU 和 GPU 的結合,能夠加快訓練計算的速度,而英偉達的 Falcon Shores 計劃尚未落地。其次,MI300A 芯片擁有 128GB 的內存,比 H100 80GB 的內存更大,意味着開發人員可以在單個芯片上加載更大、更復雜的人工智能模型,而不是將其拆分到多個芯片上,分割模型會使訓練和運行速度變慢且更加耗電。此外,很多初創公司也正致力於讓非英偉達芯片也可以兼容生態。比如 Lamini 一直致力於簡化在 AMD GPU 上構建人工智能模型的困難;Modular 正在構建軟件,以允許開發人員在不同類型的硬件上訓練和運行模型。週二,AMD表示,正計劃收購一家名為 Nod.ai 的人工智能初創公司,以增強其人工智能軟件的開發能力,以便更輕鬆地部署針對 AMD 芯片的人工智能模型。