--- title: "效率提升 9 倍!英偉達新模型 Nemotron 3 Nano Omni 瞄準智能體落地,整合語音、視覺與推理能力" type: "News" locale: "zh-HK" url: "https://longbridge.com/zh-HK/news/284441916.md" description: "儘管能力擴展至多模態與智能體場景,新模型仍延續 Nano 定位,即強調高性價比與推理效率,參數 300 億、激活 30 億,支持超長上下文,最高達百萬 token。富士康、Palantir 等 AI 與軟件領域的公司目前已採用新模型,戴爾、甲骨文等公司正在對其進行評估。" datetime: "2026-04-28T16:04:44.000Z" locales: - [zh-CN](https://longbridge.com/zh-CN/news/284441916.md) - [en](https://longbridge.com/en/news/284441916.md) - [zh-HK](https://longbridge.com/zh-HK/news/284441916.md) --- # 效率提升 9 倍!英偉達新模型 Nemotron 3 Nano Omni 瞄準智能體落地,整合語音、視覺與推理能力 在人工智能智能體(AI Agent)競賽持續升温之際,英偉達正加速從 “算力霸主” 向 “模型平台商” 延伸。 美東時間 28 日週二,英偉達在公司博客宣佈,推出名為 Nemotron 3 Nano Omni 的全新開源模型,主打 “原生全模態理解 + 高效推理”,試圖為企業級 AI Agent 提供一體化基礎模型底座。英偉達介紹,這款業內領先的開源全模態推理模型融合了視覺、音頻與語言能力,將幫助 AI 智能體實現高達 9 倍的效率提升。 英偉達介紹,已有一批 AI 與軟件領域的公司率先採用了 Nemotron 3 Nano Omni,包括 Aible、Applied Scientific Intelligence (ASI)、Eka Care、富士康、H Company、Palantir 和 Pyler。此外,戴爾、DocuSign、Infosys、K-Dense、Lila、甲骨文和 Zefr 正在對該模型進行評估。 ## **主打 Omni:一個模型打通語音、視覺與語言** 不同於傳統多模態模型通常通過拼接多個子模型實現能力融合,Nemotron 3 Nano Omni 強調 “原生全模態(omni-understanding)”。其可同時處理文本、圖像、音頻甚至視頻輸入,並在統一架構內完成理解與推理任務。 英偉達在技術博客中指出,該模型具備從視頻和文檔中提取信息的能力,支持複雜場景下的跨模態推理,例如通過語音轉錄增強視頻理解,或結合 OCR 解析視覺文本內容。 從架構上看,Nemotron 3 Nano Omni 延續了 Nemotron 3 系列的混合架構路線:融合 Transformer 與 Mamba 機制,並引入混合專家(MoE)以在保持性能的同時大幅降低推理成本。 ## **瞄準 AI 智能體 從理解走向執行** 此次發佈的核心關鍵詞並非多模態,而是智能體。英偉達明確將 Nemotron 3 系列定位為代理式(agentic)AI 的基礎模型,即不僅用於生成內容,更用於驅動具備決策與執行能力的智能體系統。 官方資料顯示,Nano Omni 是首個 “生產級開放模型”,專為構建可擴展 AI Agent 設計,支持長上下文、多步驟推理以及工具調用等能力。 同時,該模型還引入 GUI 訓練數據,使 AI 可以理解和操作界面元素,進一步貼近真實應用場景,例如自動化辦公流程、軟件操作甚至複雜工作流執行。 媒體解讀認為,這種 “全模態 +Agent” 組合意味着 AI 系統可以直接處理現實世界中的非結構化數據(視頻、語音、文檔),並據此做出決策,從而拓展 AI 在企業中的落地邊界。 ## **效率仍是核心賣點:小模型撬動大能力** 儘管能力擴展至多模態與智能體場景,Nemotron 3 Nano Omni 仍延續 “Nano” 定位,即強調高性價比與推理效率。 Nemotron 3 Nano 基礎模型採用約 300 億參數規模,但通過 MoE 機制每次僅激活參數 30 億,在性能與成本之間取得平衡。同時,該系列模型支持超長上下文(最高達百萬 token 級別),適合處理複雜文檔與長流程任務。 在英偉達整體產品體系中,Nano、Super 與 Ultra 形成梯度:Nano 強調效率,Super 面向高吞吐企業場景,Ultra 則瞄準前沿推理能力。 ## **開源生態對抗閉源陣營** 值得注意的是,英偉達再次強調 “開放”。Nemotron 3 Nano Omni 不僅開放模型權重,還配套提供訓練數據、工具鏈(如 NeMo)以及優化方案,試圖打造完整開發生態。 這一策略正值 AI 行業分化加劇之際:一方面,部分頭部廠商逐步轉向閉源;另一方面,中國及開源社區持續推進開放模型。英偉達試圖以 “開放 + 高性能” 切入中間地帶,吸引開發者與企業客户。 從更宏觀角度看,隨着 AI 應用從 “聊天機器人” 邁向 “智能代理”,模型能力的競爭也從單一語言理解升級為多模態融合 + 任務執行能力的系統競爭。 Nemotron 3 Nano Omni 的推出,標誌着英偉達不僅要賣 “鏟子”(GPU),也要提供 “施工方案”(模型與工具鏈),進一步加深其在 AI 產業鏈中的縱深佈局。 ### 相關股票 - [NVDA.US](https://longbridge.com/zh-HK/quote/NVDA.US.md) - [NVDL.US](https://longbridge.com/zh-HK/quote/NVDL.US.md) - [NVDU.US](https://longbridge.com/zh-HK/quote/NVDU.US.md) - [NVDX.US](https://longbridge.com/zh-HK/quote/NVDX.US.md) - [07788.HK](https://longbridge.com/zh-HK/quote/07788.HK.md) - [07388.HK](https://longbridge.com/zh-HK/quote/07388.HK.md) - [NVDY.US](https://longbridge.com/zh-HK/quote/NVDY.US.md) - [NVDD.US](https://longbridge.com/zh-HK/quote/NVDD.US.md) - [NVDQ.US](https://longbridge.com/zh-HK/quote/NVDQ.US.md) - [SOXL.US](https://longbridge.com/zh-HK/quote/SOXL.US.md) ## 相關資訊與研究 - [輝達發布新模型 Nemotron-3 效能狂飆 9 倍、橫掃 6 大榜單](https://longbridge.com/zh-HK/news/284494324.md) - [Cognex 推出由 NVIDIA 驅動的 In-Sight 視覺控制器](https://longbridge.com/zh-HK/news/284403101.md) - [輝達投資超級智慧!前 DeepMind 研究員成立 AI 新創 Ineffable Intelligence](https://longbridge.com/zh-HK/news/284278888.md) - [台灣大:企業事業營收年增 26% 2030 年目標千億](https://longbridge.com/zh-HK/news/284522948.md) - [香港迪士尼 CEO 帶魔雪奇緣小白亮相 搶先 Say Hi 影相識擺 Pose 傳百萬美元研發](https://longbridge.com/zh-HK/news/284336456.md)