--- title: "黄仁勋的 “Agent 工厂” 里,装了什么新故事?" type: "News" locale: "zh-CN" url: "https://longbridge.com/zh-CN/news/288251673.md" description: "2026 年 6 月 1 日,英伟达 CEO 黄仁勋在 COMPUTEX 2026 GTC 大会上发布新战略,聚焦 Agent 生态。Vera Rubin 平台正式量产并交付,DGX Station 推出 Windows 版,联合宇树发布首款人形机器人参考设计 H2 Plus。黄仁勋强调 Agent AI 时代已到来,AI 作为 GDP 生成器将增加软件工程师需求,而非减少就业。" datetime: "2026-06-01T10:01:56.000Z" locales: - [zh-CN](https://longbridge.com/zh-CN/news/288251673.md) - [en](https://longbridge.com/en/news/288251673.md) - [zh-HK](https://longbridge.com/zh-HK/news/288251673.md) --- # 黄仁勋的 “Agent 工厂” 里,装了什么新故事? 2026 年 6 月 1 日,在 COMPUTEX 2026 期间举办的 NVIDIA GTC Taipei 大会上,英伟达创始人兼 CEO 黄仁勋发表主题演讲。 距离上一场 GTC,不过三个月。 当时,英伟达发布了 Vera Rubin 的 “芯片全家桶”,包括:Vera CPU、Rubin GPU、Groq 3 LPU、ConnectX-9、BlueField-4 DPU、Spectrum-6 交换机,六颗芯片构成一台机架级 AI 超算,并宣告训练大型 MoE 模型所需 GPU 数量降至四分之一,推理吞吐量每瓦提升 10 倍,单 token 成本降至十分之一。 **和之前强调 “芯片全家桶”、“算力全家桶” 这种系统级解决方案不同,三个月后 COMPUTEX,黄仁勋把目光投向这些基础设施将服务的目标——Agent。** 黄仁勋在演讲中透露:Vera Rubin 正式进入量产,Vera CPU 开始向全球交付,DGX Station 第一次以 Windows 形态走进企业桌面,Cosmos 3 重构物理 AI 的感知框架,DSX 成为 AI 工厂的运营操作系统。英伟达还联合宇树发布了 H2 Plus——首款基于 Isaac GR00T 的人形机器人参考设计,把 Agent 的边界从数字世界延伸到物理形态。 英伟达正在围绕 Agent 生态,重新组织从芯片、数据中心、模型、软件到机器人平台的完整技术体系。 黄仁勋说:“Agent AI 和实用型人工智能时代已经到来。现在 token(也称 ‘词元’)是利润单位,AI 是 GDP‘生成器’,软件工程师的数量正在增加。人们谈论 AI 减少了工作岗位,这完全是胡说八道,实际上有更多的软件工程师正在被雇用”。 ## **同样的 AI 工厂,跑出 10 倍 Agent 任务** Vera Rubin 平台已全面投产。 与过去主要面向大模型训练和推理不同,Vera Rubin 从设计之初就把 Agent 作为重点工作负载。 黄仁勋在演讲中表示,一个 Agent 任务往往不只是一次模型推理,而是包含推理、搜索、工具调用、代码执行和结果验证等多个环节,背后可能涉及数千个步骤。未来数据中心需要处理的,也不再只是单个模型请求,更多的是大量持续运行、相互协作的 Agent 任务。 该平台被定义为一个巨大的、统一的计算单元级 AI 超级计算机,专为处理从推理、检索到工具使用的智能体工作负载而构建。在同样规模的超大型数据中心里,用全新的 Vera Rubin 平台来运行自主 AI 智能体的任务,其处理效率是上一代 Grace Blackwell 平台的 10 倍。 除了计算平台本身,网络也成为 Vera Rubin 升级的重点之一。 过去数据中心里,GPU 之间的数据传输主要依赖传统光模块和交换机架构,但当集群规模持续扩大后,功耗、散热和部署复杂度都会快速上升。为此,英伟达在 Vera Rubin 平台中引入了 Spectrum-X Ethernet Photonics 网络系统。 这是英伟达首次将共封装光学(CPO)技术大规模引入 AI 数据中心网络。 简单来说,传统方案需要把光模块插在交换机外部,而 CPO 则直接把光学器件集成到交换机内部,从而减少能耗和信号损失。 此外,安全也是此次 Vera Rubin 平台重点强调的核心能力。 为此,英伟达将机密计算(Confidential Computing)能力扩展到整个 Vera Rubin 平台。通过可信执行环境、硬件级验证以及端到端加密机制,企业能够在处理私有数据、行业敏感信息和关键模型时获得更高等级的安全保障。 黄仁勋透露,Vera Rubin 已经进入量产阶段。作为第三代 MGX 机架级系统,其背后涉及超过 150 家合作伙伴、350 多座工厂以及覆盖 30 多个国家和地区的供应链体系。按照英伟达公布的计划,Vera Rubin 将于今年秋季开始正式出货。 ## **“为 Agent 而生” 的处理器** 英伟达推出了专为智能体时代设计的新型处理器 Vera,并已全面投产。 黄仁勋指出,内存系统的进步将推动存储系统进行创新和现代化升级。至今为止的所有 CPU 都是为人类打造的,而 Vera 是为 AI 时代设计的 CPU,为智能体打造。 作为 Grace 的继任者,Vera 采用了英伟达自主设计的 “Olympus” CPU 核心架构,核心数量从 72 个提升至 88 个,并大幅提高内存和数据处理能力。据英伟达介绍,在 Agent 相关工作负载测试中,Vera 的任务执行速度达到同期 x86 服务器 CPU 的 1.8 倍。 相比单纯的性能提升,更重要的变化在于 Vera 与 Rubin GPU 之间的关系:Vera 通过第二代 NVLink-C2C 与 Rubin GPU 连接,互联带宽达到 1.8TB/s,Agent 运行过程中在 CPU 和 GPU 之间传递数据的开销进一步降低。 黄仁勋表示,Vera Rubin 采用美光、SK 海力士和三星的 HBM(高带宽内存),供应链规模是上一代 Blackwell 的 “两倍”。不过,部署一个大型 Blackwell 机架需要两个小时,而 Vera Rubin 的时间被压缩到 5 分钟级别。 ## **让 AI 工厂从 “建设” 走向 “运营”** NVIDIA 这次推出的 DSX,可以理解为一套 “AI 工厂建设和运营工具箱”。 过去建设 AI 数据中心,客户需要分别考虑服务器、网络、电力、冷却、机房设计和运维系统,很多环节依赖不同供应商协同。DSX 要做的,是把这些原本分散的环节放到同一个框架里,让客户从设计、仿真、建设到运营,都有一套可参考、可验证的标准方案。 黄仁勋在发布会现场表示:NVIDIA 不只是卖芯片,而是要给基础设施建设者一套完整的 AI 工厂蓝图。 这次 DSX 最重要的新增能力主要有两个。 第一个是 DSX MaxLPS。它解决的是 AI 工厂最现实的问题:在电力预算固定的情况下,如何放下更多 GPU、跑出更多 Token。 按照英伟达的说法,MaxLPS 结合液冷和机架内功耗优化,可以让运营商在不明显影响性能的情况下,多运行最多 40% 的 GPU。 第二个是 DSX OS。它相当于 AI 工厂的运营软件,负责生命周期管理、智能调度、健康监测、故障恢复、多租户管理等工作。简单来说,如果 AI 工厂是一座复杂工厂,DSX OS 负责让这座工厂持续稳定运转。 在 DSX 的产品矩阵当中,Reference Design 提供 AI 工厂参考设计,告诉客户机房、机架、网络、电力和冷却系统应该如何搭建;DSX Sim 负责仿真,让客户在建设前先验证设计是否可行;DSX Flex 把 AI 工厂和电网连接起来,让数据中心可以根据电价、负荷和需求响应信号调整任务;DSX Exchange 则负责打通 IT 系统、运营系统、能源和冷却系统之间的数据接口。 在生态系统方面,CoreWeave、Crusoe、Lambda 等云合作伙伴正部署 DSX Sim、MaxLPS 和 DSX OS 以降低风险并提高 GPU 利用率。戴尔、HPE、联想、Supermicro 以及华硕、富士康、技嘉、云达科技等制造商正构建支持 DSX 的系统。 ## **与 Windows 和 ARM 抱团** 现场演讲中,黄仁勋官宣 “DGX Station for Windows” 工作站登台亮相,被英伟达定义为面向 Windows 生态的桌面级 AI 超级计算机。 硬件上,它搭载 GB300 Grace Blackwell Ultra Desktop Superchip,通过 NVLink-C2C 连接 Blackwell Ultra GPU 与 72 核 Grace CPU,最高提供 748GB 统一内存和 20 PFLOPS FP4 性能,并配备最高 800Gb/s 网络能力。 这款产品的重点在于 Agent 部署方式的变化。 英伟达希望企业能够在本地、安全、可管理的 Windows 环境中运行多个 Agent,并将其接入设计、工程、数据科学、推理和 Physical AI 等工作流。同步推出的 OpenShell 负责 Agent 运行安全,通过隔离沙箱和系统级策略控制,限制 Agent 越权操作或泄露凭证、私有数据。 除了面向企业桌面的产品,黄仁勋还在会上发了一颗系统级 SoC——RTX Spark SoC,把 N1X CPU 和 Blackwell GPU 做进了一块芯片上,统一内存架构,专门给轻薄笔记本和小型台式机用。 其中,N1X 是英伟达与微软共同打造的首款 PC 处理器,它基于 Arm 架构,由联发科定制设计,台积电 3 纳米工艺制造。今秋首发搭载于微软、戴尔、惠普、华硕、联想和微星的笔记本,首批超过 30 款机型,主打高端轻薄本。 这是英伟达为 AI PC 时代准备的 “超级芯”,黄仁勋把它视为 PC 形态的一次重要重构。 ## **Agent 的 “两个大脑”** 这次发布会上,英伟达公布了两条核心模型产品线的最新进展,分别对应 Agent 的两个场景:一个跑在企业系统里,一个跑在物理世界中。 英伟达发布了一款拥有 5500 亿参数的混合专家模型 Nemotron 3 Ultra,可为代码开发、科研及企业业务流程中的长效智能体提供顶尖智能能力。相较于同级别主流开源前沿模型,该模型推理速度最高提升 5 倍,使用成本最高降低 30%,助力智能体更高效、低成本地完成各项任务。 围绕 Nemotron 开放模型,英伟达发布了一系列软件、开源模型和合作进展,目标是让企业在工程设计、医疗健康、软件开发和业务运营等场景中,构建能够协助员工工作的 “数字同事”。 这套组合里,Nemotron 提供基础模型能力,NemoClaw 负责把模型组织成 Agent,OpenShell 负责运行时安全,Agent Toolkit 则把 CUDA-X 等英伟达软件库变成 Agent 可以直接调用的工具。Agent 可以在受控环境中使用工具、调用数据、执行任务,并接入企业现有系统。 黄仁勋表示,全球软件公司正在把 AI Agent 带入真实工作系统,让它们帮助员工更快完成复杂任务。NemoClaw 提供了构建长期运行 Agent 所需的开放组件,包括编排、上下文、记忆、工具调用和安全控制等能力。 过去企业讨论 AI,更多关注模型能回答什么;现在英伟达要解决的是,Agent 如何安全地接入工具、数据和业务流程,并在真实工作中持续运行。 还有 Cosmos 3,作为 Cosmos 系列的第三代正式发布,也是一次架构层面的重构。 Cosmos 3 是一个面向物理 AI 的世界基础模型,提供 “理解物理世界、预测会发生什么、决定怎么做” 的底层能力。 和此前的 Cosmos 相比,早期版本主要面向机器人和自动驾驶开发者,做的是视频生成和物理世界模拟,本质上是个相对单模态的生成框架。Cosmos 3 换了一套架构——混合 Transformer,首次把视觉推理、世界生成和动作预测三件事统一到了一个系统里。 它能原生理解并生成文本、图像、视频、环境声音和动作,在物理准确性上达到领先水平,是全球首个完全开放的全能模型。英伟达称,它有望把物理 AI 的训练和评估周期从过去的数月压缩到数天。 黄仁勋预测,得益于多模态推理语言、视觉和世界模型的突破,物理 AI 的大爆炸即将来临。 Cosmos 3 系列开放的前沿全能模型为开发者提供了代际飞跃的能力,用于构建能够在物理世界中感知、推理、规划和行动的机器人、自动驾驶汽车和视觉 AI。 ## **降低 Physical AI 门槛** 英伟达与宇树联合发布 H2 Plus——一台为研究和开发者准备的人形机器人样板机。 “样板” 的意思是:宇树负责机器人本体,英伟达负责软件和计算平台,两边把硬件和软件预先整合好,开发团队拿到就能直接开始做技能开发,不用自己再花时间解决底层对接问题。它也是全球首款基于 NVIDIA Isaac GR00T 开发平台构建的开放式人形机器人。 这款样板机瞄准的是人形机器人开发中一个长期存在的痛点:硬件集成、数据采集、仿真、训练、评估、部署,各环节各自为战,整个流程高度碎片化。 英伟达表示,研究团队拿到一个机器人本体,往往要花大量时间在底层拼凑上,真正的技能开发反而被一再推后。H2 Plus 尝试做的事,就是把这条路打通,让研究团队跳过底层集成,直接进入技能开发和真实场景验证。 在黄仁勋看来,人形机器人将为全球最大的产业带来物理 AI,开启数万亿美元的经济机遇,而 H2 Plus 就是把前沿研究往工厂、仓库、物流系统这些真实场景推进的起点。 此外,英伟达还宣布,正式开源一套物理 AI Skills(技能)工具集,覆盖机器人、自动驾驶、视觉 AI 和工业数字孪生等核心场景。 所谓 “技能”,可以理解为英伟达把自己旗下的 Cosmos、Omniverse、Isaac、Metropolis 等平台的使用方式标准化之后,写成了智能体可以直接读懂、直接执行的操作指令,这些指令打包开源出来,就是这次发布的工具集。 智能体接到一个任务,比如生成一批检测缺陷的训练数据,它就知道该调用哪个模型、输出什么格式、怎么验证结果,整个过程自动跑完,不需要人一步步去操作每个环节。 ## **升级 AI 存储:从 “跑得快” 到 “管得住”** 在 3 月份的圣何塞 GTC 上,英伟达发布了 Vera BlueField-4 STX,当时黄仁勋重点讲的是 “AI 原生存储架构”,核心卖点是为智能体长上下文推理提供高性能 KV Cache 存储支撑。 现在,英伟达在 STX 基础上宣布新增一套安全能力,重点从 “存储性能” 变成了 “存储安全”。 这里的核心逻辑和思考,是因为背景是企业 AI 的使用方式在变化。现在很多企业都积极部署智能体,当 Agent 接入企业系统,在无人直接监督的情况下持续读写、跨系统共享信息——谁在访问什么数据、有没有越权、有没有泄露,这都是企业头疼的问题。 英伟达的解法是,在加速存储的基础上加了一层安全能力——靠着一套统一的 NVIDIA DOCA 安全软件,以及在 BlueField-4 芯片里直接硬性执行策略,基于 STX 的平台可以实时检查和管控代理、数据和上下文记忆之间的互动,帮企业在 AI 数据路径上实现持续的策略执行。 黄仁勋解释称:“智能体把企业数据变成了一个实时、活生生的系统,而这个系统必须在数据移动之处、上下文存储之处、智能体行动之处都得到保护。Vera BlueField-4 STX 要做的,就是用天生安全的设计,在芯片中以 AI 的速度执行信任”。 ## **与台积电 “互为供应商”** 这次大会中,非常有意思的一个点是英伟达和台积电的合作——目前,台积电正利用 NVIDIA 技术提升先进晶圆厂的周转时间、能效、良率与运营生产力。 台积电和英伟达的关系,过去三十年只有一种形态:台积电帮英伟达造芯片。但现在,角色发生了微妙的变化,英伟达开始帮台积电 “管工厂”。 黄仁勋表示:“英伟达和台积电已合作近三十年,不断推动计算的极限。台积电正在将英伟达的 AI 和加速计算引入晶圆厂内部,通过仿真、优化和 AI 应对全球最复杂的设计和制造挑战,以提高下一代芯片的速度、效率和良率。” 两者的关系,从单向的甲乙方,变成了双向的相互依存。 ## **结语** 回看这场发布会,英伟达正在围绕 “Agent” 拼凑新的蓝图。 Vera CPU 为 Agent 调度任务,Vera Rubin 为 Agent 提供算力,BlueField-4 STX 为 Agent 守住数据安全,Cosmos 3 让 Agent 理解物理世界,Nemotron+NemoClaw+OpenShell 让 Agent 可以被组织、被调用、被约束,DGX Station for Windows 让 Agent 进入企业员工的桌面,H2 Plus 让 Agent 拥有身体,DSX 和 Skills 让这一切可以被批量生产、批量部署。 从这个角度看,黄仁勋试图描绘的是一个新的计算时代。这也呼应了他在开场提到的 “Agent AI 和实用型人工智能时代已经到来”。 归根结底,黄仁勋这次想讲的就是一件事:当 Agent 成为 AI 基础设施,每一层都能有英伟达。 风险提示及免责条款 市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。 ### 相关股票 - [NVDA.US](https://longbridge.com/zh-CN/quote/NVDA.US.md) - [NVDL.US](https://longbridge.com/zh-CN/quote/NVDL.US.md) - [07788.HK](https://longbridge.com/zh-CN/quote/07788.HK.md) - [07388.HK](https://longbridge.com/zh-CN/quote/07388.HK.md) - [NVDY.US](https://longbridge.com/zh-CN/quote/NVDY.US.md) - [NVDD.US](https://longbridge.com/zh-CN/quote/NVDD.US.md) - [NVDX.US](https://longbridge.com/zh-CN/quote/NVDX.US.md) - [NVDQ.US](https://longbridge.com/zh-CN/quote/NVDQ.US.md) - [SOXL.US](https://longbridge.com/zh-CN/quote/SOXL.US.md) ## 相关资讯与研究 - [Adobe 将于 2026 年 6 月 11 日发布第二财季财报,市场聚焦 AI 战略与增长动能](https://longbridge.com/zh-CN/news/288319567.md) - [Super Micro to ship new Vera Rubin-based systems](https://longbridge.com/zh-CN/news/288303099.md) - [英伟达助力优步与 Autobrains,在慕尼黑试水 Robotaxi](https://longbridge.com/zh-CN/news/288260401.md) - [风华高科:英伟达未对公司开展任何产品认证](https://longbridge.com/zh-CN/news/288168132.md) - [宝鼎科技:公司未与英伟达有过接触 也未与其开展任何形式的业务合作](https://longbridge.com/zh-CN/news/288167207.md)