作者:周源/华尔街见闻6 月 5 日和之前一日,AMD 次第宣布连续完成两笔战略收购:以未公开条款收购开源软件公司 Brium,以及从 AI 推理芯片开发商 Untether AI 收购核心工程师团队。这两笔交易是 AMD 继 2023 年收购 Mipsology、Nod.ai 及 2024 年收购 Silo AI 后的最新动作,标志着 AMD 构建全栈 AI 解决方案的战略进入新阶段。AMD 的这两笔交易,旨在构建 “芯片 - 软件 - 系统” 三位一体的竞争力。Untether AI 的芯片设计能力强化了 AMD 在边缘计算和数据中心的硬件实力,而 Brium 的软件优化能力,填补了 AMD 在推理环节的生态短板。这种 “软硬兼施” 的策略与 AMD 此前收购 Mipsology(编译器)、Nod.ai(框架适配)等公司的逻辑一致,目的都是形成完整的 AI 技术栈。Brium 的核心技术是优化 AI 推理软件在不同硬件架构上的运行效率。该公司更重要的技术路线主要集中在云端 AI 软件生态,工具被集成到 PyTorch 官方插件库,开发者可通过简单配置,实现 AMD 硬件加速。这种开源策略有助于吸引更多开发者使用 AMD 平台,逐步打破英伟达 CUDA 的垄断地位。换句话说,Brium 开发的工具可将原本针对英伟达 GPU 设计的 AI 模型适配到 AMD Instinct GPU 等平台,解决 “工作负载通常根据英伟达 GPU 做广泛调整” 的行业痛点。这一技术能力对 AMD 具有战略价值:当前全球超过 80% 的 AI 软件基于英伟达 CUDA 生态开发,而 AMD Instinct MI300X 等硬件虽在算力参数上接近英伟达 H100,但实际部署时性能释放不足 50%。此次收购 Brium,是 AMD 构建开放 AI 软件生态的重要一环。自 2023 年以来,AMD 通过收购 Mipsology(Zebra 编译器)、Nod.ai(Shark 抽象层)和 Silo AI(大模型开发团队),已形成覆盖编译器、框架适配、模型训练的完整软件栈。Brium 被纳入 AMD 阵营,将进一步强化 AMD 在设计 AI 加速卡时推理环节的优化能力,帮助开发者实现 “一次开发、多平台部署”,由此降低对英伟达硬件的依赖。值得注意的是,Brium 的技术路线与 AMD 近期推出的 ROCm 6.0 框架能形成互补。问题是,ROCm 6.0 引入新的自动调优工具,但在跨硬件兼容性上仍存在局限。Brium 的解决方案,可在保持模型精度的前提下,将推理延迟降低 30%+,尤其在医疗影像分析、金融风控等对实时性要求高的场景中具有显著优势。Untether AI 的核心价值在于其具有低功耗、高性能的 AI 推理芯片技术。该公司为通用汽车、梅赛德斯 - 奔驰等车企开发的芯片,在自动驾驶感知系统中实现了比竞品快 2 倍、节能 40% 的技术性能。通过动态资源分配,独特的空间架构(Spatial Architecture)可在边缘设备上高效运行复杂的视觉 Transformer 模型,同时支持企业数据中心的高密度部署。此次被 AMD 收购的工程师团队,将直接增强 AMD 两项技术能力:一是 AI 编译器开发,Untether AI 在动态编译和内核优化方面的经验,能提升 AMD 硬件的软件适配效率;二是 SoC 设计,被收购团队曾主导开发过集成 AI 加速器的车规级芯片,有助于 AMD 拓展自动驾驶和工业物联网市场。连续收购反映了 AMD 从 “硬件供应商” 向 “AI 解决方案提供商” 的转型。通过整合 Brium 的软件优化能力和 Untether 工程团队的芯片设计经验,AMD 正在构建 “芯片 - 软件 - 系统” 三位一体的竞争力。这一战略在其 2024 年收购 ZT Systems(数据中心基础设施公司)时已初现端倪:通过将硬件、网络和系统集成能力纳入自身体系,AMD 得以与英伟达的 DGX 系统直接竞争。在技术层面,AMD 的全栈布局聚焦两大方向:一是通过开源生态吸引开发者,如 Brium 的工具已集成到 PyTorch 官方插件库,开发者可通过简单配置实现 AMD 硬件加速;二是优化边缘 - 云端协同,Untether 的芯片支持与 AMD MI300X GPU 的混合部署,在智能工厂场景中能大幅降低整体推理延迟。当前 AI 芯片市场仍由英伟达主导,其数据中心 GPU 市占率高达 75%,且采用 Blackwell 架构的新品 B200 在推理性能上领先 AMD MI325X 两倍以上。AMD 的应对策略是 “差异化竞争”:在高端市场,通过 MI300X 的 1.5TB HBM 容量抢占大模型单节点部署场景;在边缘市场,借助 Untether 的低功耗技术,快速切入自动驾驶、工业机器人等领域。开源生态的构建是 AMD 破局的关键。通过收购 Brium 等公司,AMD 已将 ROCm 框架的开发者数量提升至 20 万,较 2023 年增长 300%。但这个数量与英伟达 CUDA 的 200 万开发者基数相比,差距依然非常大。因此,AMD 需在工具链成熟度、文档支持等方面持续投入,像 Brium 在博客中提到其工具仍需手动调整环境变量才能达到最佳性能,这一问题亟待解决。巨头收购,通常会带来整合不力的问题,比如英特尔就是,数次大规模收购都没能带来预期中的正向反馈。因此,连续收购对 AMD 的整合能力也提出了考验。2022 年,AMD 收购 Xilinx 后,AMD 花了 18 个月才完成产品线协同,而 Brium 和 Untether 的团队分散在多个国家,文化差异和技术路线整合可能影响在组织和商业上的进度。此外,AMD 在一季度研发支出达 17.3 亿美元,其中约 30% 用于软件生态建设,但与英伟达同期 58 亿美元的研发投入,差距明显。除了组织和文化整合,能否取得预期中的市场验证,也是 AMD 面临的另一大挑战。AMD MI325X 虽在硬件参数上领先,但实际部署中因软件问题导致性能仅达标称值的 60%,客户更倾向选择英伟达 B200。Brium 和 Untether 的技术能否在 2025 年底前显著改善这一状况,将决定 AMD 能否在 AI 芯片市场实现份额突破。