---
title: "黄仁勋的 “Agent 工厂” 里，装了什么新故事？"
type: "News"
locale: "zh-CN"
url: "https://longbridge.com/zh-CN/news/288251673.md"
description: "2026 年 6 月 1 日，英伟达 CEO 黄仁勋在 COMPUTEX 2026 GTC 大会上发布新战略，聚焦 Agent 生态。Vera Rubin 平台正式量产并交付，DGX Station 推出 Windows 版，联合宇树发布首款人形机器人参考设计 H2 Plus。黄仁勋强调 Agent AI 时代已到来，AI 作为 GDP 生成器将增加软件工程师需求，而非减少就业。"
datetime: "2026-06-01T10:01:56.000Z"
locales:
  - [zh-CN](https://longbridge.com/zh-CN/news/288251673.md)
  - [en](https://longbridge.com/en/news/288251673.md)
  - [zh-HK](https://longbridge.com/zh-HK/news/288251673.md)
---

# 黄仁勋的 “Agent 工厂” 里，装了什么新故事？

2026 年 6 月 1 日，在 COMPUTEX 2026 期间举办的 NVIDIA GTC Taipei 大会上，英伟达创始人兼 CEO 黄仁勋发表主题演讲。

距离上一场 GTC，不过三个月。

当时，英伟达发布了 Vera Rubin 的 “芯片全家桶”，包括：Vera CPU、Rubin GPU、Groq 3 LPU、ConnectX-9、BlueField-4 DPU、Spectrum-6 交换机，六颗芯片构成一台机架级 AI 超算，并宣告训练大型 MoE 模型所需 GPU 数量降至四分之一，推理吞吐量每瓦提升 10 倍，单 token 成本降至十分之一。

**和之前强调 “芯片全家桶”、“算力全家桶” 这种系统级解决方案不同，三个月后 COMPUTEX，黄仁勋把目光投向这些基础设施将服务的目标——Agent。**

黄仁勋在演讲中透露：Vera Rubin 正式进入量产，Vera CPU 开始向全球交付，DGX Station 第一次以 Windows 形态走进企业桌面，Cosmos 3 重构物理 AI 的感知框架，DSX 成为 AI 工厂的运营操作系统。英伟达还联合宇树发布了 H2 Plus——首款基于 Isaac GR00T 的人形机器人参考设计，把 Agent 的边界从数字世界延伸到物理形态。

英伟达正在围绕 Agent 生态，重新组织从芯片、数据中心、模型、软件到机器人平台的完整技术体系。

黄仁勋说：“Agent AI 和实用型人工智能时代已经到来。现在 token（也称 ‘词元’）是利润单位，AI 是 GDP‘生成器’，软件工程师的数量正在增加。人们谈论 AI 减少了工作岗位，这完全是胡说八道，实际上有更多的软件工程师正在被雇用”。

## **同样的 AI 工厂，跑出 10 倍 Agent 任务**

Vera Rubin 平台已全面投产。

与过去主要面向大模型训练和推理不同，Vera Rubin 从设计之初就把 Agent 作为重点工作负载。

黄仁勋在演讲中表示，一个 Agent 任务往往不只是一次模型推理，而是包含推理、搜索、工具调用、代码执行和结果验证等多个环节，背后可能涉及数千个步骤。未来数据中心需要处理的，也不再只是单个模型请求，更多的是大量持续运行、相互协作的 Agent 任务。

该平台被定义为一个巨大的、统一的计算单元级 AI 超级计算机，专为处理从推理、检索到工具使用的智能体工作负载而构建。在同样规模的超大型数据中心里，用全新的 Vera Rubin 平台来运行自主 AI 智能体的任务，其处理效率是上一代 Grace Blackwell 平台的 10 倍。

除了计算平台本身，网络也成为 Vera Rubin 升级的重点之一。

过去数据中心里，GPU 之间的数据传输主要依赖传统光模块和交换机架构，但当集群规模持续扩大后，功耗、散热和部署复杂度都会快速上升。为此，英伟达在 Vera Rubin 平台中引入了 Spectrum-X Ethernet Photonics 网络系统。

这是英伟达首次将共封装光学（CPO）技术大规模引入 AI 数据中心网络。

简单来说，传统方案需要把光模块插在交换机外部，而 CPO 则直接把光学器件集成到交换机内部，从而减少能耗和信号损失。

此外，安全也是此次 Vera Rubin 平台重点强调的核心能力。

为此，英伟达将机密计算（Confidential Computing）能力扩展到整个 Vera Rubin 平台。通过可信执行环境、硬件级验证以及端到端加密机制，企业能够在处理私有数据、行业敏感信息和关键模型时获得更高等级的安全保障。

黄仁勋透露，Vera Rubin 已经进入量产阶段。作为第三代 MGX 机架级系统，其背后涉及超过 150 家合作伙伴、350 多座工厂以及覆盖 30 多个国家和地区的供应链体系。按照英伟达公布的计划，Vera Rubin 将于今年秋季开始正式出货。

## **“为 Agent 而生” 的处理器**

英伟达推出了专为智能体时代设计的新型处理器 Vera，并已全面投产。

黄仁勋指出，内存系统的进步将推动存储系统进行创新和现代化升级。至今为止的所有 CPU 都是为人类打造的，而 Vera 是为 AI 时代设计的 CPU，为智能体打造。

作为 Grace 的继任者，Vera 采用了英伟达自主设计的 “Olympus” CPU 核心架构，核心数量从 72 个提升至 88 个，并大幅提高内存和数据处理能力。据英伟达介绍，在 Agent 相关工作负载测试中，Vera 的任务执行速度达到同期 x86 服务器 CPU 的 1.8 倍。

相比单纯的性能提升，更重要的变化在于 Vera 与 Rubin GPU 之间的关系：Vera 通过第二代 NVLink-C2C 与 Rubin GPU 连接，互联带宽达到 1.8TB/s，Agent 运行过程中在 CPU 和 GPU 之间传递数据的开销进一步降低。

黄仁勋表示，Vera Rubin 采用美光、SK 海力士和三星的 HBM（高带宽内存），供应链规模是上一代 Blackwell 的 “两倍”。不过，部署一个大型 Blackwell 机架需要两个小时，而 Vera Rubin 的时间被压缩到 5 分钟级别。

## **让 AI 工厂从 “建设” 走向 “运营”**

NVIDIA 这次推出的 DSX，可以理解为一套 “AI 工厂建设和运营工具箱”。

过去建设 AI 数据中心，客户需要分别考虑服务器、网络、电力、冷却、机房设计和运维系统，很多环节依赖不同供应商协同。DSX 要做的，是把这些原本分散的环节放到同一个框架里，让客户从设计、仿真、建设到运营，都有一套可参考、可验证的标准方案。

黄仁勋在发布会现场表示：NVIDIA 不只是卖芯片，而是要给基础设施建设者一套完整的 AI 工厂蓝图。

这次 DSX 最重要的新增能力主要有两个。

第一个是 DSX MaxLPS。它解决的是 AI 工厂最现实的问题：在电力预算固定的情况下，如何放下更多 GPU、跑出更多 Token。

按照英伟达的说法，MaxLPS 结合液冷和机架内功耗优化，可以让运营商在不明显影响性能的情况下，多运行最多 40% 的 GPU。

第二个是 DSX OS。它相当于 AI 工厂的运营软件，负责生命周期管理、智能调度、健康监测、故障恢复、多租户管理等工作。简单来说，如果 AI 工厂是一座复杂工厂，DSX OS 负责让这座工厂持续稳定运转。

在 DSX 的产品矩阵当中，Reference Design 提供 AI 工厂参考设计，告诉客户机房、机架、网络、电力和冷却系统应该如何搭建；DSX Sim 负责仿真，让客户在建设前先验证设计是否可行；DSX Flex 把 AI 工厂和电网连接起来，让数据中心可以根据电价、负荷和需求响应信号调整任务；DSX Exchange 则负责打通 IT 系统、运营系统、能源和冷却系统之间的数据接口。

在生态系统方面，CoreWeave、Crusoe、Lambda 等云合作伙伴正部署 DSX Sim、MaxLPS 和 DSX OS 以降低风险并提高 GPU 利用率。戴尔、HPE、联想、Supermicro 以及华硕、富士康、技嘉、云达科技等制造商正构建支持 DSX 的系统。

## **与 Windows 和 ARM 抱团**

现场演讲中，黄仁勋官宣 “DGX Station for Windows” 工作站登台亮相，被英伟达定义为面向 Windows 生态的桌面级 AI 超级计算机。

硬件上，它搭载 GB300 Grace Blackwell Ultra Desktop Superchip，通过 NVLink-C2C 连接 Blackwell Ultra GPU 与 72 核 Grace CPU，最高提供 748GB 统一内存和 20 PFLOPS FP4 性能，并配备最高 800Gb/s 网络能力。

这款产品的重点在于 Agent 部署方式的变化。

英伟达希望企业能够在本地、安全、可管理的 Windows 环境中运行多个 Agent，并将其接入设计、工程、数据科学、推理和 Physical AI 等工作流。同步推出的 OpenShell 负责 Agent 运行安全，通过隔离沙箱和系统级策略控制，限制 Agent 越权操作或泄露凭证、私有数据。

除了面向企业桌面的产品，黄仁勋还在会上发了一颗系统级 SoC——RTX Spark SoC，把 N1X CPU 和 Blackwell GPU 做进了一块芯片上，统一内存架构，专门给轻薄笔记本和小型台式机用。

其中，N1X 是英伟达与微软共同打造的首款 PC 处理器，它基于 Arm 架构，由联发科定制设计，台积电 3 纳米工艺制造。今秋首发搭载于微软、戴尔、惠普、华硕、联想和微星的笔记本，首批超过 30 款机型，主打高端轻薄本。

这是英伟达为 AI PC 时代准备的 “超级芯”，黄仁勋把它视为 PC 形态的一次重要重构。

## **Agent 的 “两个大脑”**

这次发布会上，英伟达公布了两条核心模型产品线的最新进展，分别对应 Agent 的两个场景：一个跑在企业系统里，一个跑在物理世界中。

英伟达发布了一款拥有 5500 亿参数的混合专家模型 Nemotron 3 Ultra，可为代码开发、科研及企业业务流程中的长效智能体提供顶尖智能能力。相较于同级别主流开源前沿模型，该模型推理速度最高提升 5 倍，使用成本最高降低 30%，助力智能体更高效、低成本地完成各项任务。

围绕 Nemotron 开放模型，英伟达发布了一系列软件、开源模型和合作进展，目标是让企业在工程设计、医疗健康、软件开发和业务运营等场景中，构建能够协助员工工作的 “数字同事”。

这套组合里，Nemotron 提供基础模型能力，NemoClaw 负责把模型组织成 Agent，OpenShell 负责运行时安全，Agent Toolkit 则把 CUDA-X 等英伟达软件库变成 Agent 可以直接调用的工具。Agent 可以在受控环境中使用工具、调用数据、执行任务，并接入企业现有系统。

黄仁勋表示，全球软件公司正在把 AI Agent 带入真实工作系统，让它们帮助员工更快完成复杂任务。NemoClaw 提供了构建长期运行 Agent 所需的开放组件，包括编排、上下文、记忆、工具调用和安全控制等能力。

过去企业讨论 AI，更多关注模型能回答什么；现在英伟达要解决的是，Agent 如何安全地接入工具、数据和业务流程，并在真实工作中持续运行。

还有 Cosmos 3，作为 Cosmos 系列的第三代正式发布，也是一次架构层面的重构。

Cosmos 3 是一个面向物理 AI 的世界基础模型，提供 “理解物理世界、预测会发生什么、决定怎么做” 的底层能力。

和此前的 Cosmos 相比，早期版本主要面向机器人和自动驾驶开发者，做的是视频生成和物理世界模拟，本质上是个相对单模态的生成框架。Cosmos 3 换了一套架构——混合 Transformer，首次把视觉推理、世界生成和动作预测三件事统一到了一个系统里。

它能原生理解并生成文本、图像、视频、环境声音和动作，在物理准确性上达到领先水平，是全球首个完全开放的全能模型。英伟达称，它有望把物理 AI 的训练和评估周期从过去的数月压缩到数天。

黄仁勋预测，得益于多模态推理语言、视觉和世界模型的突破，物理 AI 的大爆炸即将来临。

Cosmos 3 系列开放的前沿全能模型为开发者提供了代际飞跃的能力，用于构建能够在物理世界中感知、推理、规划和行动的机器人、自动驾驶汽车和视觉 AI。

## **降低 Physical AI 门槛**

英伟达与宇树联合发布 H2 Plus——一台为研究和开发者准备的人形机器人样板机。

“样板” 的意思是：宇树负责机器人本体，英伟达负责软件和计算平台，两边把硬件和软件预先整合好，开发团队拿到就能直接开始做技能开发，不用自己再花时间解决底层对接问题。它也是全球首款基于 NVIDIA Isaac GR00T 开发平台构建的开放式人形机器人。

这款样板机瞄准的是人形机器人开发中一个长期存在的痛点：硬件集成、数据采集、仿真、训练、评估、部署，各环节各自为战，整个流程高度碎片化。

英伟达表示，研究团队拿到一个机器人本体，往往要花大量时间在底层拼凑上，真正的技能开发反而被一再推后。H2 Plus 尝试做的事，就是把这条路打通，让研究团队跳过底层集成，直接进入技能开发和真实场景验证。

在黄仁勋看来，人形机器人将为全球最大的产业带来物理 AI，开启数万亿美元的经济机遇，而 H2 Plus 就是把前沿研究往工厂、仓库、物流系统这些真实场景推进的起点。

此外，英伟达还宣布，正式开源一套物理 AI Skills（技能）工具集，覆盖机器人、自动驾驶、视觉 AI 和工业数字孪生等核心场景。

所谓 “技能”，可以理解为英伟达把自己旗下的 Cosmos、Omniverse、Isaac、Metropolis 等平台的使用方式标准化之后，写成了智能体可以直接读懂、直接执行的操作指令，这些指令打包开源出来，就是这次发布的工具集。

智能体接到一个任务，比如生成一批检测缺陷的训练数据，它就知道该调用哪个模型、输出什么格式、怎么验证结果，整个过程自动跑完，不需要人一步步去操作每个环节。

## **升级 AI 存储：从 “跑得快” 到 “管得住”**

在 3 月份的圣何塞 GTC 上，英伟达发布了 Vera BlueField-4 STX，当时黄仁勋重点讲的是 “AI 原生存储架构”，核心卖点是为智能体长上下文推理提供高性能 KV Cache 存储支撑。

现在，英伟达在 STX 基础上宣布新增一套安全能力，重点从 “存储性能” 变成了 “存储安全”。

这里的核心逻辑和思考，是因为背景是企业 AI 的使用方式在变化。现在很多企业都积极部署智能体，当 Agent 接入企业系统，在无人直接监督的情况下持续读写、跨系统共享信息——谁在访问什么数据、有没有越权、有没有泄露，这都是企业头疼的问题。

英伟达的解法是，在加速存储的基础上加了一层安全能力——靠着一套统一的 NVIDIA DOCA 安全软件，以及在 BlueField-4 芯片里直接硬性执行策略，基于 STX 的平台可以实时检查和管控代理、数据和上下文记忆之间的互动，帮企业在 AI 数据路径上实现持续的策略执行。

黄仁勋解释称：“智能体把企业数据变成了一个实时、活生生的系统，而这个系统必须在数据移动之处、上下文存储之处、智能体行动之处都得到保护。Vera BlueField-4 STX 要做的，就是用天生安全的设计，在芯片中以 AI 的速度执行信任”。

## **与台积电 “互为供应商”**

这次大会中，非常有意思的一个点是英伟达和台积电的合作——目前，台积电正利用 NVIDIA 技术提升先进晶圆厂的周转时间、能效、良率与运营生产力。

台积电和英伟达的关系，过去三十年只有一种形态：台积电帮英伟达造芯片。但现在，角色发生了微妙的变化，英伟达开始帮台积电 “管工厂”。

黄仁勋表示：“英伟达和台积电已合作近三十年，不断推动计算的极限。台积电正在将英伟达的 AI 和加速计算引入晶圆厂内部，通过仿真、优化和 AI 应对全球最复杂的设计和制造挑战，以提高下一代芯片的速度、效率和良率。”

两者的关系，从单向的甲乙方，变成了双向的相互依存。

## **结语**

回看这场发布会，英伟达正在围绕 “Agent” 拼凑新的蓝图。

Vera CPU 为 Agent 调度任务，Vera Rubin 为 Agent 提供算力，BlueField-4 STX 为 Agent 守住数据安全，Cosmos 3 让 Agent 理解物理世界，Nemotron+NemoClaw+OpenShell 让 Agent 可以被组织、被调用、被约束，DGX Station for Windows 让 Agent 进入企业员工的桌面，H2 Plus 让 Agent 拥有身体，DSX 和 Skills 让这一切可以被批量生产、批量部署。

从这个角度看，黄仁勋试图描绘的是一个新的计算时代。这也呼应了他在开场提到的 “Agent AI 和实用型人工智能时代已经到来”。

归根结底，黄仁勋这次想讲的就是一件事：当 Agent 成为 AI 基础设施，每一层都能有英伟达。

风险提示及免责条款

市场有风险，投资需谨慎。本文不构成个人投资建议，也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资，责任自负。

### 相关股票

- [NVDA.US](https://longbridge.com/zh-CN/quote/NVDA.US.md)
- [NVDL.US](https://longbridge.com/zh-CN/quote/NVDL.US.md)
- [07788.HK](https://longbridge.com/zh-CN/quote/07788.HK.md)
- [07388.HK](https://longbridge.com/zh-CN/quote/07388.HK.md)
- [NVDY.US](https://longbridge.com/zh-CN/quote/NVDY.US.md)
- [NVDD.US](https://longbridge.com/zh-CN/quote/NVDD.US.md)
- [NVDX.US](https://longbridge.com/zh-CN/quote/NVDX.US.md)
- [NVDQ.US](https://longbridge.com/zh-CN/quote/NVDQ.US.md)
- [SOXL.US](https://longbridge.com/zh-CN/quote/SOXL.US.md)

## 相关资讯与研究

- [Adobe 将于 2026 年 6 月 11 日发布第二财季财报，市场聚焦 AI 战略与增长动能](https://longbridge.com/zh-CN/news/288319567.md)
- [Super Micro to ship new Vera Rubin-based systems](https://longbridge.com/zh-CN/news/288303099.md)
- [英伟达助力优步与 Autobrains，在慕尼黑试水 Robotaxi](https://longbridge.com/zh-CN/news/288260401.md)
- [风华高科：英伟达未对公司开展任何产品认证](https://longbridge.com/zh-CN/news/288168132.md)
- [跑赢 96% 同行的科技基金押注 SK 海力士：供应收紧助力 AI 存储芯片，长期持有很轻松](https://longbridge.com/zh-CN/news/288210688.md)