--- title: "全球首個用於醫學視頻的開源 LLM 已發佈,全球開發者社區被號召進一步開發" type: "News" locale: "zh-HK" url: "https://longbridge.com/zh-HK/news/284106617.md" description: "聯影智能(UII)推出了 uAI NEXUS MedVLM,這是全球首個開源的大型語言模型(LLM),專為醫學視頻設計,在臨牀環境中提供前所未有的空間和時間精度。該模型基於 531,850 對視頻指令的數據集,在關鍵醫學視頻任務中顯著超越了領先模型如 GPT-5.4 和 Gemini 3.1。UII 邀請全球的人工智能研究人員和開發者參與一個開放挑戰,以推動醫學視頻智能的發展,首步是發佈基準測試樣本。該倡議旨在提升外科工作流程中的決策制定和質量控制" datetime: "2026-04-26T09:33:58.000Z" locales: - [zh-CN](https://longbridge.com/zh-CN/news/284106617.md) - [en](https://longbridge.com/en/news/284106617.md) - [zh-HK](https://longbridge.com/zh-HK/news/284106617.md) --- # 全球首個用於醫學視頻的開源 LLM 已發佈,全球開發者社區被號召進一步開發 ,/PRNewswire/ -- 聯影智能(UII)推出了 uAI NEXUS MedVLM,這是一個突破性的醫療視頻大型語言模型,在臨牀環境中提供前所未有的空間和時間精度。 UII 將該模型完全開源,並推出了一個新的全面基準,用於行業評估。該研究成果已被 2026 年計算機視覺與模式識別會議(CVPR)接受,彰顯了其在全球計算機視覺社區中的認可。 繼續閲讀 該雷達圖中顯示的統計數據來自研究論文:https://arxiv.org/abs/2512.06581 image2 uAI NEXUS MedVLM 基於一個龐大的數據集,包含來自 8 個臨牀場景的 531,850 個視頻指令對,包括機器人手術、腹腔鏡手術、內窺鏡檢查、開放手術和護理。 僅憑 4B/7B 參數,uAI NEXUS MedVLM 在重要的醫療視頻任務中顯著超越了領先的通用基礎模型,包括 GPT-5.4 和 Gemini 3.1。它在評估手術安全性方面的準確率達到 89.4%,而 GPT-5.4 為 1.8%,Gemini 3.1 為 10.1%。在時空動作定位方面,其 mIoU 值比 GPT-5.4 高出多達 14 倍,比 Gemini 3.1 高出 4 倍。在生成視頻報告方面,其得分為 4.2 分(滿分 5 分),明顯超過了 GPT-5.4(2.5 分)和 Gemini 3.1(2.4 分)。 (來源:上述性能統計數據來自研究論文:https://arxiv.org/abs/2512.06581) **啓動全球開放挑戰以加速共同創新** 為了推動醫療視頻 LLM 模型的發展,UII 已開始逐步發佈其數據集 “MedVidBench”,首批開放源代碼發佈了 6,245 個經過嚴格審核的基準測試樣本。該倡議涵蓋了八個不同的手術數據集,在規模和臨牀精度上均為全球首創。 開發者可以在統一的排行榜上評估他們的模型,提交的貢獻將根據私有參考數據自動進行評估。結果將反映在一個持續更新的全球排行榜上,提供不同模型的透明和可比的性能評估。 UII 邀請全球的 AI 研究人員、開發者和醫療機構參與這一開放挑戰,通過協作創新推動醫療視頻智能的發展。 **項目頁面:** https://uii-ai.github.io/MedGRPO/ **在所有醫療視頻任務中推動智能化** 理解醫療視頻長期以來一直是人工智能面臨的最大挑戰之一——它需要微觀的空間意識、複雜的時間邏輯和無可妥協的臨牀準確性。過去,進展受到臨牀數據嚴重匱乏和專家註釋成本高昂的制約。 UII 克服了這一瓶頸。通過為多樣化的臨牀視頻開發一個全面的逐幀註釋框架,我們嚴格捕捉了關鍵屬性:器械軌跡、空間定位、精確的手術動作和關鍵風險指標。這一前所未有的數據基礎為 uAI NEXUS MedVLM 提供了完整而強大的臨牀智能堆棧。 在此基礎上,該模型無縫集成了感知、思考和決策。它提供了高精度的器械時空定位和自動化過程識別,並利用先進的推理將複雜的視頻序列轉化為結構化的臨牀報告、區域描述和快速工作流程摘要。超越被動觀察,它將這些洞察提升為主動決策,支持對下一步的預測、手術能力的評估和全面的安全風險評估。 **將 AI 創新轉化為臨牀實踐中的效果** uAI NEXUS MedVLM 旨在臨牀應用,能夠在手術工作流程中實現更為明智的決策和數據驅動的質量控制,同時縮短臨牀醫生的學習曲線,提高培訓的效率和一致性。 展望未來,uAI NEXUS MedVLM 可以作為一箇中心感知和認知引擎,為在物理世界中運作的具身 AI 提供支持。它們共同構成一個視覺感知、認知思維和物理執行的閉環系統,為更自動化、標準化和智能化的健康生態系統鋪平道路。 照片 - https://mma.prnewswire.com/media/2964990/image1.jpg 照片 - https://mma.prnewswire.com/media/2964989/image2.jpg ### 相關股票 - [688271.CN](https://longbridge.com/zh-HK/quote/688271.CN.md) ## 相關資訊與研究 - [創新藥龍頭捷報頻傳,硬核創新夯實長期價值](https://longbridge.com/zh-HK/news/287145423.md) - [聯影宣佈外科佈局全面落地](https://longbridge.com/zh-HK/news/282194470.md) - [LeCun 炮轟 Hinton:他認可 LLM 就是想擺爛退休了!](https://longbridge.com/zh-HK/news/286723278.md) - [【AI】騰訊開源 Agent Memory,最高降低 61%Token 消耗](https://longbridge.com/zh-HK/news/286394426.md) - [吃開源飯砸開源的鍋](https://longbridge.com/zh-HK/news/286832910.md)