---
title: "效率提升 9 倍！英偉達新模型 Nemotron 3 Nano Omni 瞄準智能體落地，整合語音、視覺與推理能力"
type: "News"
locale: "zh-HK"
url: "https://longbridge.com/zh-HK/news/284441916.md"
description: "儘管能力擴展至多模態與智能體場景，新模型仍延續 Nano 定位，即強調高性價比與推理效率，參數 300 億、激活 30 億，支持超長上下文，最高達百萬 token。富士康、Palantir 等 AI 與軟件領域的公司目前已採用新模型，戴爾、甲骨文等公司正在對其進行評估。"
datetime: "2026-04-28T16:04:44.000Z"
locales:
  - [zh-CN](https://longbridge.com/zh-CN/news/284441916.md)
  - [en](https://longbridge.com/en/news/284441916.md)
  - [zh-HK](https://longbridge.com/zh-HK/news/284441916.md)
---

# 效率提升 9 倍！英偉達新模型 Nemotron 3 Nano Omni 瞄準智能體落地，整合語音、視覺與推理能力

在人工智能智能體（AI Agent）競賽持續升温之際，英偉達正加速從 “算力霸主” 向 “模型平台商” 延伸。

美東時間 28 日週二，英偉達在公司博客宣佈，推出名為 Nemotron 3 Nano Omni 的全新開源模型，主打 “原生全模態理解 + 高效推理”，試圖為企業級 AI Agent 提供一體化基礎模型底座。英偉達介紹，這款業內領先的開源全模態推理模型融合了視覺、音頻與語言能力，將幫助 AI 智能體實現高達 9 倍的效率提升。

英偉達介紹，已有一批 AI 與軟件領域的公司率先採用了 Nemotron 3 Nano Omni，包括 Aible、Applied Scientific Intelligence (ASI)、Eka Care、富士康、H Company、Palantir 和 Pyler。此外，戴爾、DocuSign、Infosys、K-Dense、Lila、甲骨文和 Zefr 正在對該模型進行評估。

## **主打 Omni：一個模型打通語音、視覺與語言**

不同於傳統多模態模型通常通過拼接多個子模型實現能力融合，Nemotron 3 Nano Omni 強調 “原生全模態（omni-understanding）”。其可同時處理文本、圖像、音頻甚至視頻輸入，並在統一架構內完成理解與推理任務。

英偉達在技術博客中指出，該模型具備從視頻和文檔中提取信息的能力，支持複雜場景下的跨模態推理，例如通過語音轉錄增強視頻理解，或結合 OCR 解析視覺文本內容。

從架構上看，Nemotron 3 Nano Omni 延續了 Nemotron 3 系列的混合架構路線：融合 Transformer 與 Mamba 機制，並引入混合專家（MoE）以在保持性能的同時大幅降低推理成本。

## **瞄準 AI 智能體 從理解走向執行**

此次發佈的核心關鍵詞並非多模態，而是智能體。英偉達明確將 Nemotron 3 系列定位為代理式（agentic）AI 的基礎模型，即不僅用於生成內容，更用於驅動具備決策與執行能力的智能體系統。

官方資料顯示，Nano Omni 是首個 “生產級開放模型”，專為構建可擴展 AI Agent 設計，支持長上下文、多步驟推理以及工具調用等能力。

同時，該模型還引入 GUI 訓練數據，使 AI 可以理解和操作界面元素，進一步貼近真實應用場景，例如自動化辦公流程、軟件操作甚至複雜工作流執行。

媒體解讀認為，這種 “全模態 +Agent” 組合意味着 AI 系統可以直接處理現實世界中的非結構化數據（視頻、語音、文檔），並據此做出決策，從而拓展 AI 在企業中的落地邊界。

## **效率仍是核心賣點：小模型撬動大能力**

儘管能力擴展至多模態與智能體場景，Nemotron 3 Nano Omni 仍延續 “Nano” 定位，即強調高性價比與推理效率。

Nemotron 3 Nano 基礎模型採用約 300 億參數規模，但通過 MoE 機制每次僅激活參數 30 億，在性能與成本之間取得平衡。同時，該系列模型支持超長上下文（最高達百萬 token 級別），適合處理複雜文檔與長流程任務。

在英偉達整體產品體系中，Nano、Super 與 Ultra 形成梯度：Nano 強調效率，Super 面向高吞吐企業場景，Ultra 則瞄準前沿推理能力。

## **開源生態對抗閉源陣營**

值得注意的是，英偉達再次強調 “開放”。Nemotron 3 Nano Omni 不僅開放模型權重，還配套提供訓練數據、工具鏈（如 NeMo）以及優化方案，試圖打造完整開發生態。

這一策略正值 AI 行業分化加劇之際：一方面，部分頭部廠商逐步轉向閉源；另一方面，中國及開源社區持續推進開放模型。英偉達試圖以 “開放 + 高性能” 切入中間地帶，吸引開發者與企業客户。

從更宏觀角度看，隨着 AI 應用從 “聊天機器人” 邁向 “智能代理”，模型能力的競爭也從單一語言理解升級為多模態融合 + 任務執行能力的系統競爭。

Nemotron 3 Nano Omni 的推出，標誌着英偉達不僅要賣 “鏟子”（GPU），也要提供 “施工方案”（模型與工具鏈），進一步加深其在 AI 產業鏈中的縱深佈局。

### 相關股票

- [NVDA.US](https://longbridge.com/zh-HK/quote/NVDA.US.md)
- [NVDL.US](https://longbridge.com/zh-HK/quote/NVDL.US.md)
- [NVDU.US](https://longbridge.com/zh-HK/quote/NVDU.US.md)
- [NVDX.US](https://longbridge.com/zh-HK/quote/NVDX.US.md)
- [07788.HK](https://longbridge.com/zh-HK/quote/07788.HK.md)
- [07388.HK](https://longbridge.com/zh-HK/quote/07388.HK.md)
- [NVDY.US](https://longbridge.com/zh-HK/quote/NVDY.US.md)
- [NVDD.US](https://longbridge.com/zh-HK/quote/NVDD.US.md)
- [NVDQ.US](https://longbridge.com/zh-HK/quote/NVDQ.US.md)
- [SOXL.US](https://longbridge.com/zh-HK/quote/SOXL.US.md)

## 相關資訊與研究

- [輝達發布新模型 Nemotron-3 效能狂飆 9 倍、橫掃 6 大榜單](https://longbridge.com/zh-HK/news/284494324.md)
- [Cognex 推出由 NVIDIA 驅動的 In-Sight 視覺控制器](https://longbridge.com/zh-HK/news/284403101.md)
- [輝達投資超級智慧！前 DeepMind 研究員成立 AI 新創 Ineffable Intelligence](https://longbridge.com/zh-HK/news/284278888.md)
- [台灣大：企業事業營收年增 26% 2030 年目標千億](https://longbridge.com/zh-HK/news/284522948.md)
- [香港迪士尼 CEO 帶魔雪奇緣小白亮相 搶先 Say Hi 影相識擺 Pose 傳百萬美元研發](https://longbridge.com/zh-HK/news/284336456.md)