--- title: "黃仁勳的 “Agent 工廠” 裏,裝了什麼新故事?" type: "News" locale: "zh-HK" url: "https://longbridge.com/zh-HK/news/288251673.md" description: "2026 年 6 月 1 日,英偉達 CEO 黃仁勳在 COMPUTEX 2026 GTC 大會上發佈新戰略,聚焦 Agent 生態。Vera Rubin 平台正式量產並交付,DGX Station 推出 Windows 版,聯合宇樹發佈首款人形機器人蔘考設計 H2 Plus。黃仁勳強調 Agent AI 時代已到來,AI 作為 GDP 生成器將增加軟件工程師需求,而非減少就業。" datetime: "2026-06-01T10:01:56.000Z" locales: - [zh-CN](https://longbridge.com/zh-CN/news/288251673.md) - [en](https://longbridge.com/en/news/288251673.md) - [zh-HK](https://longbridge.com/zh-HK/news/288251673.md) --- # 黃仁勳的 “Agent 工廠” 裏,裝了什麼新故事? 2026 年 6 月 1 日,在 COMPUTEX 2026 期間舉辦的 NVIDIA GTC Taipei 大會上,英偉達創始人兼 CEO 黃仁勳發表主題演講。 距離上一場 GTC,不過三個月。 當時,英偉達發佈了 Vera Rubin 的 “芯片全家桶”,包括:Vera CPU、Rubin GPU、Groq 3 LPU、ConnectX-9、BlueField-4 DPU、Spectrum-6 交換機,六顆芯片構成一台機架級 AI 超算,並宣告訓練大型 MoE 模型所需 GPU 數量降至四分之一,推理吞吐量每瓦提升 10 倍,單 token 成本降至十分之一。 **和之前強調 “芯片全家桶”、“算力全家桶” 這種系統級解決方案不同,三個月後 COMPUTEX,黃仁勳把目光投向這些基礎設施將服務的目標——Agent。** 黃仁勳在演講中透露:Vera Rubin 正式進入量產,Vera CPU 開始向全球交付,DGX Station 第一次以 Windows 形態走進企業桌面,Cosmos 3 重構物理 AI 的感知框架,DSX 成為 AI 工廠的運營操作系統。英偉達還聯合宇樹發佈了 H2 Plus——首款基於 Isaac GR00T 的人形機器人蔘考設計,把 Agent 的邊界從數字世界延伸到物理形態。 英偉達正在圍繞 Agent 生態,重新組織從芯片、數據中心、模型、軟件到機器人平台的完整技術體系。 黃仁勳説:“Agent AI 和實用型人工智能時代已經到來。現在 token(也稱 ‘詞元’)是利潤單位,AI 是 GDP‘生成器’,軟件工程師的數量正在增加。人們談論 AI 減少了工作崗位,這完全是胡説八道,實際上有更多的軟件工程師正在被僱用”。 ## **同樣的 AI 工廠,跑出 10 倍 Agent 任務** Vera Rubin 平台已全面投產。 與過去主要面向大模型訓練和推理不同,Vera Rubin 從設計之初就把 Agent 作為重點工作負載。 黃仁勳在演講中表示,一個 Agent 任務往往不只是一次模型推理,而是包含推理、搜索、工具調用、代碼執行和結果驗證等多個環節,背後可能涉及數千個步驟。未來數據中心需要處理的,也不再只是單個模型請求,更多的是大量持續運行、相互協作的 Agent 任務。 該平台被定義為一個巨大的、統一的計算單元級 AI 超級計算機,專為處理從推理、檢索到工具使用的智能體工作負載而構建。在同樣規模的超大型數據中心裏,用全新的 Vera Rubin 平台來運行自主 AI 智能體的任務,其處理效率是上一代 Grace Blackwell 平台的 10 倍。 除了計算平台本身,網絡也成為 Vera Rubin 升級的重點之一。 過去數據中心裏,GPU 之間的數據傳輸主要依賴傳統光模塊和交換機架構,但當集羣規模持續擴大後,功耗、散熱和部署複雜度都會快速上升。為此,英偉達在 Vera Rubin 平台中引入了 Spectrum-X Ethernet Photonics 網絡系統。 這是英偉達首次將共封裝光學(CPO)技術大規模引入 AI 數據中心網絡。 簡單來説,傳統方案需要把光模塊插在交換機外部,而 CPO 則直接把光學器件集成到交換機內部,從而減少能耗和信號損失。 此外,安全也是此次 Vera Rubin 平台重點強調的核心能力。 為此,英偉達將機密計算(Confidential Computing)能力擴展到整個 Vera Rubin 平台。通過可信執行環境、硬件級驗證以及端到端加密機制,企業能夠在處理私有數據、行業敏感信息和關鍵模型時獲得更高等級的安全保障。 黃仁勳透露,Vera Rubin 已經進入量產階段。作為第三代 MGX 機架級系統,其背後涉及超過 150 家合作伙伴、350 多座工廠以及覆蓋 30 多個國家和地區的供應鏈體系。按照英偉達公佈的計劃,Vera Rubin 將於今年秋季開始正式出貨。 ## **“為 Agent 而生” 的處理器** 英偉達推出了專為智能體時代設計的新型處理器 Vera,並已全面投產。 黃仁勳指出,內存系統的進步將推動存儲系統進行創新和現代化升級。至今為止的所有 CPU 都是為人類打造的,而 Vera 是為 AI 時代設計的 CPU,為智能體打造。 作為 Grace 的繼任者,Vera 採用了英偉達自主設計的 “Olympus” CPU 核心架構,核心數量從 72 個提升至 88 個,並大幅提高內存和數據處理能力。據英偉達介紹,在 Agent 相關工作負載測試中,Vera 的任務執行速度達到同期 x86 服務器 CPU 的 1.8 倍。 相比單純的性能提升,更重要的變化在於 Vera 與 Rubin GPU 之間的關係:Vera 通過第二代 NVLink-C2C 與 Rubin GPU 連接,互聯帶寬達到 1.8TB/s,Agent 運行過程中在 CPU 和 GPU 之間傳遞數據的開銷進一步降低。 黃仁勳表示,Vera Rubin 採用美光、SK 海力士和三星的 HBM(高帶寬內存),供應鏈規模是上一代 Blackwell 的 “兩倍”。不過,部署一個大型 Blackwell 機架需要兩個小時,而 Vera Rubin 的時間被壓縮到 5 分鐘級別。 ## **讓 AI 工廠從 “建設” 走向 “運營”** NVIDIA 這次推出的 DSX,可以理解為一套 “AI 工廠建設和運營工具箱”。 過去建設 AI 數據中心,客户需要分別考慮服務器、網絡、電力、冷卻、機房設計和運維繫統,很多環節依賴不同供應商協同。DSX 要做的,是把這些原本分散的環節放到同一個框架裏,讓客户從設計、仿真、建設到運營,都有一套可參考、可驗證的標準方案。 黃仁勳在發佈會現場表示:NVIDIA 不只是賣芯片,而是要給基礎設施建設者一套完整的 AI 工廠藍圖。 這次 DSX 最重要的新增能力主要有兩個。 第一個是 DSX MaxLPS。它解決的是 AI 工廠最現實的問題:在電力預算固定的情況下,如何放下更多 GPU、跑出更多 Token。 按照英偉達的説法,MaxLPS 結合液冷和機架內功耗優化,可以讓運營商在不明顯影響性能的情況下,多運行最多 40% 的 GPU。 第二個是 DSX OS。它相當於 AI 工廠的運營軟件,負責生命週期管理、智能調度、健康監測、故障恢復、多租户管理等工作。簡單來説,如果 AI 工廠是一座複雜工廠,DSX OS 負責讓這座工廠持續穩定運轉。 在 DSX 的產品矩陣當中,Reference Design 提供 AI 工廠參考設計,告訴客户機房、機架、網絡、電力和冷卻系統應該如何搭建;DSX Sim 負責仿真,讓客户在建設前先驗證設計是否可行;DSX Flex 把 AI 工廠和電網連接起來,讓數據中心可以根據電價、負荷和需求響應信號調整任務;DSX Exchange 則負責打通 IT 系統、運營系統、能源和冷卻系統之間的數據接口。 在生態系統方面,CoreWeave、Crusoe、Lambda 等雲合作伙伴正部署 DSX Sim、MaxLPS 和 DSX OS 以降低風險並提高 GPU 利用率。戴爾、HPE、聯想、Supermicro 以及華碩、富士康、技嘉、雲達科技等製造商正構建支持 DSX 的系統。 ## **與 Windows 和 ARM 抱團** 現場演講中,黃仁勳官宣 “DGX Station for Windows” 工作站登台亮相,被英偉達定義為面向 Windows 生態的桌面級 AI 超級計算機。 硬件上,它搭載 GB300 Grace Blackwell Ultra Desktop Superchip,通過 NVLink-C2C 連接 Blackwell Ultra GPU 與 72 核 Grace CPU,最高提供 748GB 統一內存和 20 PFLOPS FP4 性能,並配備最高 800Gb/s 網絡能力。 這款產品的重點在於 Agent 部署方式的變化。 英偉達希望企業能夠在本地、安全、可管理的 Windows 環境中運行多個 Agent,並將其接入設計、工程、數據科學、推理和 Physical AI 等工作流。同步推出的 OpenShell 負責 Agent 運行安全,通過隔離沙箱和系統級策略控制,限制 Agent 越權操作或泄露憑證、私有數據。 除了面向企業桌面的產品,黃仁勳還在會上發了一顆系統級 SoC——RTX Spark SoC,把 N1X CPU 和 Blackwell GPU 做進了一塊芯片上,統一內存架構,專門給輕薄筆記本和小型台式機用。 其中,N1X 是英偉達與微軟共同打造的首款 PC 處理器,它基於 Arm 架構,由聯發科定製設計,台積電 3 納米工藝製造。今秋首發搭載於微軟、戴爾、惠普、華碩、聯想和微星的筆記本,首批超過 30 款機型,主打高端輕薄本。 這是英偉達為 AI PC 時代準備的 “超級芯”,黃仁勳把它視為 PC 形態的一次重要重構。 ## **Agent 的 “兩個大腦”** 這次發佈會上,英偉達公佈了兩條核心模型產品線的最新進展,分別對應 Agent 的兩個場景:一個跑在企業系統裏,一個跑在物理世界中。 英偉達發佈了一款擁有 5500 億參數的混合專家模型 Nemotron 3 Ultra,可為代碼開發、科研及企業業務流程中的長效智能體提供頂尖智能能力。相較於同級別主流開源前沿模型,該模型推理速度最高提升 5 倍,使用成本最高降低 30%,助力智能體更高效、低成本地完成各項任務。 圍繞 Nemotron 開放模型,英偉達發佈了一系列軟件、開源模型和合作進展,目標是讓企業在工程設計、醫療健康、軟件開發和業務運營等場景中,構建能夠協助員工工作的 “數字同事”。 這套組合裏,Nemotron 提供基礎模型能力,NemoClaw 負責把模型組織成 Agent,OpenShell 負責運行時安全,Agent Toolkit 則把 CUDA-X 等英偉達軟件庫變成 Agent 可以直接調用的工具。Agent 可以在受控環境中使用工具、調用數據、執行任務,並接入企業現有系統。 黃仁勳表示,全球軟件公司正在把 AI Agent 帶入真實工作系統,讓它們幫助員工更快完成複雜任務。NemoClaw 提供了構建長期運行 Agent 所需的開放組件,包括編排、上下文、記憶、工具調用和安全控制等能力。 過去企業討論 AI,更多關注模型能回答什麼;現在英偉達要解決的是,Agent 如何安全地接入工具、數據和業務流程,並在真實工作中持續運行。 還有 Cosmos 3,作為 Cosmos 系列的第三代正式發佈,也是一次架構層面的重構。 Cosmos 3 是一個面向物理 AI 的世界基礎模型,提供 “理解物理世界、預測會發生什麼、決定怎麼做” 的底層能力。 和此前的 Cosmos 相比,早期版本主要面向機器人和自動駕駛開發者,做的是視頻生成和物理世界模擬,本質上是個相對單模態的生成框架。Cosmos 3 換了一套架構——混合 Transformer,首次把視覺推理、世界生成和動作預測三件事統一到了一個系統裏。 它能原生理解並生成文本、圖像、視頻、環境聲音和動作,在物理準確性上達到領先水平,是全球首個完全開放的全能模型。英偉達稱,它有望把物理 AI 的訓練和評估週期從過去的數月壓縮到數天。 黃仁勳預測,得益於多模態推理語言、視覺和世界模型的突破,物理 AI 的大爆炸即將來臨。 Cosmos 3 系列開放的前沿全能模型為開發者提供了代際飛躍的能力,用於構建能夠在物理世界中感知、推理、規劃和行動的機器人、自動駕駛汽車和視覺 AI。 ## **降低 Physical AI 門檻** 英偉達與宇樹聯合發佈 H2 Plus——一台為研究和開發者準備的人形機器人樣板機。 “樣板” 的意思是:宇樹負責機器人本體,英偉達負責軟件和計算平台,兩邊把硬件和軟件預先整合好,開發團隊拿到就能直接開始做技能開發,不用自己再花時間解決底層對接問題。它也是全球首款基於 NVIDIA Isaac GR00T 開發平台構建的開放式人形機器人。 這款樣板機瞄準的是人形機器人開發中一個長期存在的痛點:硬件集成、數據採集、仿真、訓練、評估、部署,各環節各自為戰,整個流程高度碎片化。 英偉達表示,研究團隊拿到一個機器人本體,往往要花大量時間在底層拼湊上,真正的技能開發反而被一再推後。H2 Plus 嘗試做的事,就是把這條路打通,讓研究團隊跳過底層集成,直接進入技能開發和真實場景驗證。 在黃仁勳看來,人形機器人將為全球最大的產業帶來物理 AI,開啓數萬億美元的經濟機遇,而 H2 Plus 就是把前沿研究往工廠、倉庫、物流系統這些真實場景推進的起點。 此外,英偉達還宣佈,正式開源一套物理 AI Skills(技能)工具集,覆蓋機器人、自動駕駛、視覺 AI 和工業數字孿生等核心場景。 所謂 “技能”,可以理解為英偉達把自己旗下的 Cosmos、Omniverse、Isaac、Metropolis 等平台的使用方式標準化之後,寫成了智能體可以直接讀懂、直接執行的操作指令,這些指令打包開源出來,就是這次發佈的工具集。 智能體接到一個任務,比如生成一批檢測缺陷的訓練數據,它就知道該調用哪個模型、輸出什麼格式、怎麼驗證結果,整個過程自動跑完,不需要人一步步去操作每個環節。 ## **升級 AI 存儲:從 “跑得快” 到 “管得住”** 在 3 月份的聖何塞 GTC 上,英偉達發佈了 Vera BlueField-4 STX,當時黃仁勳重點講的是 “AI 原生存儲架構”,核心賣點是為智能體長上下文推理提供高性能 KV Cache 存儲支撐。 現在,英偉達在 STX 基礎上宣佈新增一套安全能力,重點從 “存儲性能” 變成了 “存儲安全”。 這裏的核心邏輯和思考,是因為背景是企業 AI 的使用方式在變化。現在很多企業都積極部署智能體,當 Agent 接入企業系統,在無人直接監督的情況下持續讀寫、跨系統共享信息——誰在訪問什麼數據、有沒有越權、有沒有泄露,這都是企業頭疼的問題。 英偉達的解法是,在加速存儲的基礎上加了一層安全能力——靠着一套統一的 NVIDIA DOCA 安全軟件,以及在 BlueField-4 芯片裏直接硬性執行策略,基於 STX 的平台可以實時檢查和管控代理、數據和上下文記憶之間的互動,幫企業在 AI 數據路徑上實現持續的策略執行。 黃仁勳解釋稱:“智能體把企業數據變成了一個實時、活生生的系統,而這個系統必須在數據移動之處、上下文存儲之處、智能體行動之處都得到保護。Vera BlueField-4 STX 要做的,就是用天生安全的設計,在芯片中以 AI 的速度執行信任”。 ## **與台積電 “互為供應商”** 這次大會中,非常有意思的一個點是英偉達和台積電的合作——目前,台積電正利用 NVIDIA 技術提升先進晶圓廠的週轉時間、能效、良率與運營生產力。 台積電和英偉達的關係,過去三十年只有一種形態:台積電幫英偉達造芯片。但現在,角色發生了微妙的變化,英偉達開始幫台積電 “管工廠”。 黃仁勳表示:“英偉達和台積電已合作近三十年,不斷推動計算的極限。台積電正在將英偉達的 AI 和加速計算引入晶圓廠內部,通過仿真、優化和 AI 應對全球最複雜的設計和製造挑戰,以提高下一代芯片的速度、效率和良率。” 兩者的關係,從單向的甲乙方,變成了雙向的相互依存。 ## **結語** 回看這場發佈會,英偉達正在圍繞 “Agent” 拼湊新的藍圖。 Vera CPU 為 Agent 調度任務,Vera Rubin 為 Agent 提供算力,BlueField-4 STX 為 Agent 守住數據安全,Cosmos 3 讓 Agent 理解物理世界,Nemotron+NemoClaw+OpenShell 讓 Agent 可以被組織、被調用、被約束,DGX Station for Windows 讓 Agent 進入企業員工的桌面,H2 Plus 讓 Agent 擁有身體,DSX 和 Skills 讓這一切可以被批量生產、批量部署。 從這個角度看,黃仁勳試圖描繪的是一個新的計算時代。這也呼應了他在開場提到的 “Agent AI 和實用型人工智能時代已經到來”。 歸根結底,黃仁勳這次想講的就是一件事:當 Agent 成為 AI 基礎設施,每一層都能有英偉達。 風險提示及免責條款 市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用户特殊的投資目標、財務狀況或需要。用户應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資,責任自負。 ### 相關股票 - [NVDA.US](https://longbridge.com/zh-HK/quote/NVDA.US.md) - [NVDL.US](https://longbridge.com/zh-HK/quote/NVDL.US.md) - [07788.HK](https://longbridge.com/zh-HK/quote/07788.HK.md) - [07388.HK](https://longbridge.com/zh-HK/quote/07388.HK.md) - [NVDY.US](https://longbridge.com/zh-HK/quote/NVDY.US.md) - [NVDD.US](https://longbridge.com/zh-HK/quote/NVDD.US.md) - [NVDX.US](https://longbridge.com/zh-HK/quote/NVDX.US.md) - [NVDQ.US](https://longbridge.com/zh-HK/quote/NVDQ.US.md) - [SOXL.US](https://longbridge.com/zh-HK/quote/SOXL.US.md) ## 相關資訊與研究 - [技嘉於 COMPUTEX 展示從機櫃級運算到真實場域部署的全方位 AI 基礎建設](https://longbridge.com/zh-HK/news/288293665.md) - [台北 101 今晚為黃仁勳點燈 蔣萬安:歡迎輝達總部落腳北市](https://longbridge.com/zh-HK/news/288232175.md) - [文湖線導入輝達 AI 技術 北捷:人流模擬 2027 完成](https://longbridge.com/zh-HK/news/288253003.md) - [樺漢強攻實體 AI 商機 攜手 Kontron 目標 2028 年多賺一股本](https://longbridge.com/zh-HK/news/288297018.md) - [〈COMPUTEX〉技嘉展出地端 AI 超級電腦支援 200B 參數模型 攜手輝達引領代理式 AI 時代](https://longbridge.com/zh-HK/news/288249842.md)