--- title: "以 ROCm 挑戰 CUDA:‘一步一個腳印’" type: "News" locale: "zh-HK" url: "https://longbridge.com/zh-HK/news/281405076.md" description: "AMD 正在專注於其 AI 軟件棧 ROCm,以在數據中心 GPU 市場與英偉達的 CUDA 競爭。AMD AI 軟件副總裁 Anush Elangovan 強調了在開發 ROCm 方面穩步進展的重要性,該項目在過去兩年半中得到了持續投資。團隊的目標是統一 AMD 硬件上的 AI 棧,並改善 AMD 和英偉達 GPU 之間的可移植性。ROCm 完全開源,允許快速的社區驅動創新,同時團隊還利用 AI 工具進行內核開發" datetime: "2026-04-01T17:03:07.000Z" locales: - [zh-CN](https://longbridge.com/zh-CN/news/281405076.md) - [en](https://longbridge.com/en/news/281405076.md) - [zh-HK](https://longbridge.com/zh-HK/news/281405076.md) --- # 以 ROCm 挑戰 CUDA:‘一步一個腳印’ //php echo do\_shortcode('\[responsivevoice\_button voice="US English Male" buttontext="Listen to Post"\]') ?\> 挑戰 AMD 從市場領導者英偉達手中奪取數據中心 GPU 市場份額的能力,肯定取決於其 AI 軟件堆棧 ROCm 的成敗。與英偉達的 CUDA 及其龐大的用户基礎競爭,被許多人視為世界上最有價值公司的最大護城河,這似乎是一項絕對龐大的任務。 “這就像爬山——一步一步來,” AMD 的 AI 軟件副總裁 Anush Elangovan 在接受 EE Times 獨家採訪時表示。“確定方向,鎖定目標,其他的就會隨之而來。” Elangovan 在兩年半前通過收購他的初創公司 Nod.ai 加入 AMD。該初創公司的 30 人團隊已經構建 AI 編譯器五到六年,並且在一些最重要的 AI 代碼庫中,如 Shark、Torch.MLIR 和 IREE,作為主要貢獻者而聞名。Nod 一直在與使用其基於編譯器的自動化軟件的超大規模企業、企業和初創公司合作。 EE Times 上次與 AMD 討論 ROCm 是在 Nod 收購之前。在那次採訪中,AI 高級副總裁 Vamsi Boppana 表示,ROCm 是 AMD 的首要任務,公司旨在統一 AMD 不同硬件類型(CPU、GPU 和 FPGA)上的 AI 堆棧。 自那時以來,Elangovan 表示,ROCm 經歷了兩年半的持續投資。 “當時的 ROCm 是一個零散的集合,” 他説。“它的成長是為了給 ASIC 提供 \[固件\]——比如,這裏有一個固件部分,這裏有一個固件部分,讓我們把它們結合起來。” 今天的 ROCm 團隊努力模仿 Elangovan 在創辦 Nod 之前所在的 Google Chrome 團隊。 “如果你是 Chrome 用户,你可能不知道自己使用的是哪個版本——你不在乎,因為它就是好用,” Elangovan 説。“我們在 ROCm 上已經達到了這一點。在接下來的幾個版本中,我們將實現六週的發佈週期。我們會達到一個它就是好用的階段,並且變得無形。” Elangovan 表示,ROCm 團隊已經彌補了最初的差距,需要繼續儘可能快速地前進。 “我們現在像軟件公司一樣發佈軟件,” 他説。“我們也像軟件公司一樣開發軟件。但我們也非常關注我們在下一次轉型中需要做的事情,那就是 AI 輔助工程。” ### **可移植性** Boppana 兩年半前談到的 AI 堆棧的統一在 Elangovan 和 Nod 團隊的努力下得以實現。內部稱為 OneROCm,儘管某些部分仍然是硬件特定的,但所有加速都是通過 ROCm 堆棧進行的,Elangovan 表示。這使得不同類型的 AMD 硬件之間的可移植性成為可能。 兩年前,Nvidia 和 AMD GPU 之間的可移植性可能是一個大問題,但隨着人們今天通常在更高的堆棧上工作,這種負擔已經減輕,Elangovan 説。這一轉變部分得益於 OpenAI 的開源 AI 框架 Triton。 “在過去,主要是將 CUDA 內核轉換為 HIP 內核,” Elangovan 説。“但越來越多的人轉向 Triton,它成為了 GPU 編程的偉大平衡器。這個偉大的平衡器允許你編寫 Triton 內核並在 AMD 或 Nvidia 上運行。我們進行了大量投資。” Nod 的一位關鍵工程師正在 AMD 領導 Triton 的工作,密切與 OpenAI 合作。AMD 還在 MLIR 上進行了大量投資,這是一個用於加速器的編譯器基礎設施,前 Nod 團隊繼續維護 Torch.MLIR,允許將代碼重新定向到不同的硬件類型。 Elangovan 表示,從 CUDA 代碼轉換不再是一個常見的請求,因為大多數推理客户正在使用 vLLM 或 SGLang,運行一些少數的 LLM 模型,並專注於實現每秒最大數量的令牌。 “我們的團隊有 Triton 內核,所以如果有一些我們沒有預料到的新注意力算法,Triton 將是一個通用解決方案,但在一兩天內我們將會構建一個優化版本以提高速度,” 他説。“一旦我們展示出可部署性是相同的,他們可以執行 pip install vLLM,其他一切都在裏面。” HIPify 仍然可供 HPC 客户使用,但一般來説,Elangovan 表示,他依賴於像 Claude 這樣的 AI 工具來編寫和驗證新的 AMD 內核。 “Claude 比 HIPify 更好,因為它內置了網絡搜索。” ### **開源** ROCm 是 100% 開源的,固件除外。Elangovan 表示,雖然開源使 ROCm 受到開發者社區的審查,但這意味着 ROCm 可以以社區創新的速度發展,而不是 AMD 的速度。 “這樣,你可以隨意使用它並進行創新,” 他説。“每個人都可以在他們想要的任何地方進行接入,無論是編譯器還是運行時,他們的限制在於他們的能力,而不是 AMD 與他們合作的速度。” AMD 對構建開發者社區有激進的目標,並且目前正在積極進行開發者外聯。至關重要的是,ROCm 現在可以在配備 AMD Strix Halo 的筆記本電腦上開箱即用,AMD 希望這將幫助吸引開發者到該平台。Elangovan 表示,公司通常在發佈 Instinct 數據中心硬件版本的同一天發佈 Windows 筆記本電腦的 ROCm 更新。 ### **開發者社區** 與開發者社區直接互動對 Elangovan 來説是 “非常非常重要的”。 Elangovan 將自己描述為一個不情願的 X(Twitter)用户,他表示他加入該平台是為了向開發者提供公司正在做的事情的基層視角。 “人們開始關注,這成了我的一個副業,” 他笑着説。 Elangovan 個人監控 X 關鍵詞,包括 “ROCm”、“ROCm 糟糕”、“AMD 軟件無法工作”,並對每一個都做出回應。 “主要還是教育的問題,” 他説,並補充説他個人在可能的情況下為匿名開發者提供建議和支持。 去年,AMD 在 GitHub 上進行了一項關於 ROCm 投訴的投票,收到了超過 1000 個反饋。許多反饋集中在對舊硬件的支持上,而這些硬件如今要麼由 AMD 支持,要麼由社區支持,Elangovan 表示,一年後,所有 1000 個投訴都得到了處理。AMD 有一個團隊在處理 GitHub 上的投訴,但 Elangovan 仍然鼓勵開發者在 X 上聯繫他,他總是樂於傾聽。 “這真的改變了氛圍,從 AMD 開發者對不支持的驅動程序感到非常惱火,到相信他們的努力得到了認可,” 他説。“通常,當我們解決問題時,會產生乘數效應,因為人們會想,我喜歡這個解決方案……我知道 AMD 是有效的,我很樂意嘗試。” Elangovan 對即將推出的 MI450(預計在 2026 年下半年發貨)“超級興奮”,但除此之外,團隊還開始考慮 ROCm 的功能,這些功能與 CUDA 有所區別,超越了成為一個開發者可以構建的強大平台。 “我們希望 ROCm 成為一個你可以在上面構建的 10 年平台,” 他説。“你不應該擔心新硬件出現時會發生什麼。” 與此同時,Elangovan 依靠他的初創公司經驗——多年的起伏使得 Nod 開發的編譯器技術被幾乎所有加速器公司使用。 “我們需要對我們的道路有信心,然後一步一步走下去,” 他説。 * * * ##### 另見: ROCm 是 AMD 的首要任務,執行官表示 CES 2026:AMD 和 Nvidia 的物理 AI 故事如何比較? ### 相關股票 - [XLK.US](https://longbridge.com/zh-HK/quote/XLK.US.md) - [NVDY.US](https://longbridge.com/zh-HK/quote/NVDY.US.md) - [NVDL.US](https://longbridge.com/zh-HK/quote/NVDL.US.md) - [SOXL.US](https://longbridge.com/zh-HK/quote/SOXL.US.md) - [SOXX.US](https://longbridge.com/zh-HK/quote/SOXX.US.md) - [NVDS.US](https://longbridge.com/zh-HK/quote/NVDS.US.md) - [AMDL.US](https://longbridge.com/zh-HK/quote/AMDL.US.md) - [SMH.US](https://longbridge.com/zh-HK/quote/SMH.US.md) - [RSPT.US](https://longbridge.com/zh-HK/quote/RSPT.US.md) - [IGPT.US](https://longbridge.com/zh-HK/quote/IGPT.US.md) - [NVDX.US](https://longbridge.com/zh-HK/quote/NVDX.US.md) - [SOXQ.US](https://longbridge.com/zh-HK/quote/SOXQ.US.md) - [AMUU.US](https://longbridge.com/zh-HK/quote/AMUU.US.md) - [AMDD.US](https://longbridge.com/zh-HK/quote/AMDD.US.md) - [VGT.US](https://longbridge.com/zh-HK/quote/VGT.US.md) - [NVD.US](https://longbridge.com/zh-HK/quote/NVD.US.md) - [XSW.US](https://longbridge.com/zh-HK/quote/XSW.US.md) - [NVDD.US](https://longbridge.com/zh-HK/quote/NVDD.US.md) - [NVDQ.US](https://longbridge.com/zh-HK/quote/NVDQ.US.md) - [IGV.US](https://longbridge.com/zh-HK/quote/IGV.US.md) - [NVDU.US](https://longbridge.com/zh-HK/quote/NVDU.US.md) - [NVDA.US](https://longbridge.com/zh-HK/quote/NVDA.US.md) - [AMD.US](https://longbridge.com/zh-HK/quote/AMD.US.md) ## 相關資訊與研究 - [2026 年最值得買 AI 股?4 大理由告訴你為何是輝達](https://longbridge.com/zh-HK/news/282286499.md) - [微星 EdgeXpert 通過 NVIDIA 系統 全面支援 NVIDIA AI Enterprise](https://longbridge.com/zh-HK/news/282304002.md) - [兼具 GPU、CPU、CPO 多元題材 法人調高這檔千金股目標價](https://longbridge.com/zh-HK/news/282283205.md) - [將 AI 變成個人執行系統,Claude 最新 Managed Agents 實踐手冊](https://longbridge.com/zh-HK/news/282156316.md) - [AI agent 也要買軟體授權?微軟高層:視為企業新用户,要獨立付費](https://longbridge.com/zh-HK/news/282486040.md)