---
title: "全球首個開源醫療視頻大語言模型正式發佈"
type: "News"
locale: "zh-HK"
url: "https://longbridge.com/zh-HK/news/284044418.md"
description: "聯影智能（UII）推出了全球首個開源醫療視頻大型語言模型（LLM），名為 uAI NEXUS MedVLM。這個開創性的模型在臨牀環境中提供了前所未有的空間和時間準確性，並已被接受在 CVPR 2026 上進行展示。UII 發佈了該模型的源代碼，併為行業引入了全面的評估基準。該模型在關鍵醫療視頻任務中超越了主要的通用模型，如 GPT-5.4 和 Gemini 3.1，在外科安全評估中達到了 89.4% 的準確率。UII 邀請全球開發者參與開放挑戰，以加速醫療人工智能的協作創新"
datetime: "2026-04-24T18:38:58.000Z"
locales:
  - [zh-CN](https://longbridge.com/zh-CN/news/284044418.md)
  - [en](https://longbridge.com/en/news/284044418.md)
  - [zh-HK](https://longbridge.com/zh-HK/news/284044418.md)
---

# 全球首個開源醫療視頻大語言模型正式發佈

**\- 世界首個開源醫學視頻大語言模型發佈，呼籲全球開發者共同推動**

, /PRNewswire/ -- 聯影智能（UII）推出了 uAI NEXUS MedVLM，這是一種開創性的醫學視頻大規模語言模型，在臨牀環境中提供前所未有的空間和時間精度。

UII 已公開該模型的源代碼，併為其在整個行業的評估引入了一個新的綜合性基準。該研究已被 CVPR 2026 接受，這是人工智能領域的主要會議之一，突顯了其在全球計算機視覺社區的認可。

繼續閲讀

該雷達圖中顯示的統計數據來自研究論文：https://arxiv.org/abs/2512.06581

image2

uAI NEXUS MedVLM 基於一個龐大的數據集，包含 531,850 對視頻指令，涵蓋 8 種臨牀場景，包括機器人手術、腹腔鏡手術、內窺鏡檢查、開放手術和護理。

僅憑 4B/7B 參數，uAI NEXUS MedVLM 在醫學視頻的關鍵任務中顯著超越了包括 GPT-5.4 和 Gemini 3.1 在內的主要通用基礎模型。在外科安全評估中，其準確率達到 89.4%，而 GPT-5.4 為 1.8%，Gemini 3.1 為 10.1%。在時空動作定位方面，其 mIoU 比 GPT-5.4 高出 14 倍，比 Gemini 3.1 高出 4 倍。在視頻報告生成中，其得分為 4.2（滿分 5 分），大幅超越 GPT-5.4（2.5）和 Gemini 3.1（2.4）。

（來源：上述性能統計數據來自研究文章：https://arxiv.org/abs/2512.06581）

**發起全球開放挑戰以加速協作創新**

為了推動醫學視頻大語言模型（LLM）的發展，UII 分階段發佈了其 MedVidBench 數據集，首批公開了 6,245 個嚴格的基準測試樣本。該倡議涵蓋八個不同的外科數據集，代表了全球範圍內在規模和臨牀精度上的一個里程碑。

開發者可以在統一的分類中評估他們的模型，提案會與私有基準數據自動比較。結果會反映在一個持續更新的全球排名中，從而實現模型間的透明和可比性能評估。

UII 邀請全球的研究人員、開發者和醫療 AI 機構參與這一開放挑戰，並通過協作創新推動醫學視頻領域的人工智能進步。

**項目頁面：** https://uii-ai.github.io/MedGRPO/

**推動醫學視頻任務全譜的智能化**

醫學視頻的理解長期以來一直是人工智能最具挑戰性的前沿之一，要求具備微觀空間感知、複雜的時間邏輯和堅不可摧的臨牀精度。歷史上，由於臨牀數據的嚴重短缺和專家標註的高昂成本，進展一直受到阻礙。

UII 已克服了這一障礙。通過設計一個大規模的逐幀標註框架，我們在各種臨牀視頻中嚴格映射了關鍵屬性：儀器軌跡、空間定位、精確的外科動作和關鍵風險指標。這一前所未有的數據庫為 uAI NEXUS MedVLM 提供了一個全面而強大的臨牀智能平台。

基於這一基礎，該模型完美地整合了感知、推理和決策。它提供高精度的儀器時空定位和程序自動識別，應用先進的推理將複雜的視頻序列轉化為結構化的臨牀報告、區域描述和快速工作流程摘要。超越被動觀察，這些知識提升為主動決策，支持對下一步的預測、外科技能評估和安全風險的全面評估。

**將人工智能的創新轉化為實際的臨牀影響**

uAI NEXUS MedVLM 旨在臨牀實施，能夠在所有外科工作流程中實現更為明智的決策和基於數據的質量控制，同時降低醫生的學習曲線，提高培訓的效率和一致性。

展望未來，uAI NEXUS MedVLM 可以作為在物理世界中運作的集成 AI 的核心感知和認知引擎。兩者共同形成一個閉環系統，結合視覺感知、認知推理和物理執行，朝着一個更加自動化、標準化和智能化的醫療生態系統邁進。

照片 - https://mma.prnewswire.com/media/2964990/image1.jpg

照片 - https://mma.prnewswire.com/media/2964989/image2.jpg

### 相關股票

- [688271.CN](https://longbridge.com/zh-HK/quote/688271.CN.md)

## 相關資訊與研究

- [保柏：港人深圳求醫年 70 萬人次](https://longbridge.com/zh-HK/news/286818539.md)
- [佰澤醫療附屬夥美年大健康附屬構建健康管理服務體系](https://longbridge.com/zh-HK/news/286740565.md)
- [快閃英法參訪...歐洲在宅醫療模式大開眼界 石崇良：進速升級長照 3.0](https://longbridge.com/zh-HK/news/286931217.md)
- [沒住院就不理賠、傳統醫療險跟不上醫療變革 金管會 3 個月盤點現有保單](https://longbridge.com/zh-HK/news/287006784.md)
- [讓巷口診所點亮預防醫學之光：台大 EiMBA 新創團隊 Lumi Health 重新定義預防醫學](https://longbridge.com/zh-HK/news/287147571.md)