--- title: "以 ROCm 挑战 CUDA:‘一步一个脚印’" type: "News" locale: "zh-CN" url: "https://longbridge.com/zh-CN/news/281405076.md" description: "AMD 正在专注于其 AI 软件栈 ROCm,以在数据中心 GPU 市场与英伟达的 CUDA 竞争。AMD AI 软件副总裁 Anush Elangovan 强调了在开发 ROCm 方面稳步进展的重要性,该项目在过去两年半中得到了持续投资。团队的目标是统一 AMD 硬件上的 AI 栈,并改善 AMD 和英伟达 GPU 之间的可移植性。ROCm 完全开源,允许快速的社区驱动创新,同时团队还利用 AI 工具进行内核开发" datetime: "2026-04-01T17:03:07.000Z" locales: - [zh-CN](https://longbridge.com/zh-CN/news/281405076.md) - [en](https://longbridge.com/en/news/281405076.md) - [zh-HK](https://longbridge.com/zh-HK/news/281405076.md) --- # 以 ROCm 挑战 CUDA:‘一步一个脚印’ //php echo do\_shortcode('\[responsivevoice\_button voice="US English Male" buttontext="Listen to Post"\]') ?\> 挑战 AMD 从市场领导者英伟达手中夺取数据中心 GPU 市场份额的能力,肯定取决于其 AI 软件堆栈 ROCm 的成败。与英伟达的 CUDA 及其庞大的用户基础竞争,被许多人视为世界上最有价值公司的最大护城河,这似乎是一项绝对庞大的任务。 “这就像爬山——一步一步来,” AMD 的 AI 软件副总裁 Anush Elangovan 在接受 EE Times 独家采访时表示。“确定方向,锁定目标,其他的就会随之而来。” Elangovan 在两年半前通过收购他的初创公司 Nod.ai 加入 AMD。该初创公司的 30 人团队已经构建 AI 编译器五到六年,并且在一些最重要的 AI 代码库中,如 Shark、Torch.MLIR 和 IREE,作为主要贡献者而闻名。Nod 一直在与使用其基于编译器的自动化软件的超大规模企业、企业和初创公司合作。 EE Times 上次与 AMD 讨论 ROCm 是在 Nod 收购之前。在那次采访中,AI 高级副总裁 Vamsi Boppana 表示,ROCm 是 AMD 的首要任务,公司旨在统一 AMD 不同硬件类型(CPU、GPU 和 FPGA)上的 AI 堆栈。 自那时以来,Elangovan 表示,ROCm 经历了两年半的持续投资。 “当时的 ROCm 是一个零散的集合,” 他说。“它的成长是为了给 ASIC 提供 \[固件\]——比如,这里有一个固件部分,这里有一个固件部分,让我们把它们结合起来。” 今天的 ROCm 团队努力模仿 Elangovan 在创办 Nod 之前所在的 Google Chrome 团队。 “如果你是 Chrome 用户,你可能不知道自己使用的是哪个版本——你不在乎,因为它就是好用,” Elangovan 说。“我们在 ROCm 上已经达到了这一点。在接下来的几个版本中,我们将实现六周的发布周期。我们会达到一个它就是好用的阶段,并且变得无形。” Elangovan 表示,ROCm 团队已经弥补了最初的差距,需要继续尽可能快速地前进。 “我们现在像软件公司一样发布软件,” 他说。“我们也像软件公司一样开发软件。但我们也非常关注我们在下一次转型中需要做的事情,那就是 AI 辅助工程。” ### **可移植性** Boppana 两年半前谈到的 AI 堆栈的统一在 Elangovan 和 Nod 团队的努力下得以实现。内部称为 OneROCm,尽管某些部分仍然是硬件特定的,但所有加速都是通过 ROCm 堆栈进行的,Elangovan 表示。这使得不同类型的 AMD 硬件之间的可移植性成为可能。 两年前,Nvidia 和 AMD GPU 之间的可移植性可能是一个大问题,但随着人们今天通常在更高的堆栈上工作,这种负担已经减轻,Elangovan 说。这一转变部分得益于 OpenAI 的开源 AI 框架 Triton。 “在过去,主要是将 CUDA 内核转换为 HIP 内核,” Elangovan 说。“但越来越多的人转向 Triton,它成为了 GPU 编程的伟大平衡器。这个伟大的平衡器允许你编写 Triton 内核并在 AMD 或 Nvidia 上运行。我们进行了大量投资。” Nod 的一位关键工程师正在 AMD 领导 Triton 的工作,密切与 OpenAI 合作。AMD 还在 MLIR 上进行了大量投资,这是一个用于加速器的编译器基础设施,前 Nod 团队继续维护 Torch.MLIR,允许将代码重新定向到不同的硬件类型。 Elangovan 表示,从 CUDA 代码转换不再是一个常见的请求,因为大多数推理客户正在使用 vLLM 或 SGLang,运行一些少数的 LLM 模型,并专注于实现每秒最大数量的令牌。 “我们的团队有 Triton 内核,所以如果有一些我们没有预料到的新注意力算法,Triton 将是一个通用解决方案,但在一两天内我们将会构建一个优化版本以提高速度,” 他说。“一旦我们展示出可部署性是相同的,他们可以执行 pip install vLLM,其他一切都在里面。” HIPify 仍然可供 HPC 客户使用,但一般来说,Elangovan 表示,他依赖于像 Claude 这样的 AI 工具来编写和验证新的 AMD 内核。 “Claude 比 HIPify 更好,因为它内置了网络搜索。” ### **开源** ROCm 是 100% 开源的,固件除外。Elangovan 表示,虽然开源使 ROCm 受到开发者社区的审查,但这意味着 ROCm 可以以社区创新的速度发展,而不是 AMD 的速度。 “这样,你可以随意使用它并进行创新,” 他说。“每个人都可以在他们想要的任何地方进行接入,无论是编译器还是运行时,他们的限制在于他们的能力,而不是 AMD 与他们合作的速度。” AMD 对构建开发者社区有激进的目标,并且目前正在积极进行开发者外联。至关重要的是,ROCm 现在可以在配备 AMD Strix Halo 的笔记本电脑上开箱即用,AMD 希望这将帮助吸引开发者到该平台。Elangovan 表示,公司通常在发布 Instinct 数据中心硬件版本的同一天发布 Windows 笔记本电脑的 ROCm 更新。 ### **开发者社区** 与开发者社区直接互动对 Elangovan 来说是 “非常非常重要的”。 Elangovan 将自己描述为一个不情愿的 X(Twitter)用户,他表示他加入该平台是为了向开发者提供公司正在做的事情的基层视角。 “人们开始关注,这成了我的一个副业,” 他笑着说。 Elangovan 个人监控 X 关键词,包括 “ROCm”、“ROCm 糟糕”、“AMD 软件无法工作”,并对每一个都做出回应。 “主要还是教育的问题,” 他说,并补充说他个人在可能的情况下为匿名开发者提供建议和支持。 去年,AMD 在 GitHub 上进行了一项关于 ROCm 投诉的投票,收到了超过 1000 个反馈。许多反馈集中在对旧硬件的支持上,而这些硬件如今要么由 AMD 支持,要么由社区支持,Elangovan 表示,一年后,所有 1000 个投诉都得到了处理。AMD 有一个团队在处理 GitHub 上的投诉,但 Elangovan 仍然鼓励开发者在 X 上联系他,他总是乐于倾听。 “这真的改变了氛围,从 AMD 开发者对不支持的驱动程序感到非常恼火,到相信他们的努力得到了认可,” 他说。“通常,当我们解决问题时,会产生乘数效应,因为人们会想,我喜欢这个解决方案……我知道 AMD 是有效的,我很乐意尝试。” Elangovan 对即将推出的 MI450(预计在 2026 年下半年发货)“超级兴奋”,但除此之外,团队还开始考虑 ROCm 的功能,这些功能与 CUDA 有所区别,超越了成为一个开发者可以构建的强大平台。 “我们希望 ROCm 成为一个你可以在上面构建的 10 年平台,” 他说。“你不应该担心新硬件出现时会发生什么。” 与此同时,Elangovan 依靠他的初创公司经验——多年的起伏使得 Nod 开发的编译器技术被几乎所有加速器公司使用。 “我们需要对我们的道路有信心,然后一步一步走下去,” 他说。 * * * ##### 另见: ROCm 是 AMD 的首要任务,执行官表示 CES 2026:AMD 和 Nvidia 的物理 AI 故事如何比较? ### 相关股票 - [XLK.US](https://longbridge.com/zh-CN/quote/XLK.US.md) - [NVDY.US](https://longbridge.com/zh-CN/quote/NVDY.US.md) - [NVDL.US](https://longbridge.com/zh-CN/quote/NVDL.US.md) - [SOXL.US](https://longbridge.com/zh-CN/quote/SOXL.US.md) - [SOXX.US](https://longbridge.com/zh-CN/quote/SOXX.US.md) - [NVDS.US](https://longbridge.com/zh-CN/quote/NVDS.US.md) - [AMDL.US](https://longbridge.com/zh-CN/quote/AMDL.US.md) - [SMH.US](https://longbridge.com/zh-CN/quote/SMH.US.md) - [RSPT.US](https://longbridge.com/zh-CN/quote/RSPT.US.md) - [IGPT.US](https://longbridge.com/zh-CN/quote/IGPT.US.md) - [NVDX.US](https://longbridge.com/zh-CN/quote/NVDX.US.md) - [SOXQ.US](https://longbridge.com/zh-CN/quote/SOXQ.US.md) - [AMUU.US](https://longbridge.com/zh-CN/quote/AMUU.US.md) - [AMDD.US](https://longbridge.com/zh-CN/quote/AMDD.US.md) - [VGT.US](https://longbridge.com/zh-CN/quote/VGT.US.md) - [NVD.US](https://longbridge.com/zh-CN/quote/NVD.US.md) - [XSW.US](https://longbridge.com/zh-CN/quote/XSW.US.md) - [NVDD.US](https://longbridge.com/zh-CN/quote/NVDD.US.md) - [NVDQ.US](https://longbridge.com/zh-CN/quote/NVDQ.US.md) - [IGV.US](https://longbridge.com/zh-CN/quote/IGV.US.md) - [NVDU.US](https://longbridge.com/zh-CN/quote/NVDU.US.md) - [NVDA.US](https://longbridge.com/zh-CN/quote/NVDA.US.md) - [AMD.US](https://longbridge.com/zh-CN/quote/AMD.US.md) ## 相关资讯与研究 - [中国 AI 人才全面赶超:黄仁勋的担忧正在成为现实](https://longbridge.com/zh-CN/news/282285101.md) - [Anthropic 发布 Managed Agents,才发现这支硅谷华人团队早就押对了赌注](https://longbridge.com/zh-CN/news/282149364.md) - [AI 冲击加剧下行业短期缺乏增长催化剂 花旗下调 DocuSign 等多只软件股评级](https://longbridge.com/zh-CN/news/282370039.md) - [Lumentum 订单接近排满至 2028 年!光通信能否接棒存储板块,成为 AI 算力的下一个 “超级风口”?](https://longbridge.com/zh-CN/news/282309725.md) - [技术迭代、资本加码! AI 光模块正从导入期进入规模化增长期](https://longbridge.com/zh-CN/news/282264275.md)