---
title: "全球首个开源医疗视频大语言模型正式发布"
type: "News"
locale: "zh-CN"
url: "https://longbridge.com/zh-CN/news/284044418.md"
description: "联影智能（UII）推出了全球首个开源医疗视频大型语言模型（LLM），名为 uAI NEXUS MedVLM。这个开创性的模型在临床环境中提供了前所未有的空间和时间准确性，并已被接受在 CVPR 2026 上进行展示。UII 发布了该模型的源代码，并为行业引入了全面的评估基准。该模型在关键医疗视频任务中超越了主要的通用模型，如 GPT-5.4 和 Gemini 3.1，在外科安全评估中达到了 89.4% 的准确率。UII 邀请全球开发者参与开放挑战，以加速医疗人工智能的协作创新"
datetime: "2026-04-24T18:38:58.000Z"
locales:
  - [zh-CN](https://longbridge.com/zh-CN/news/284044418.md)
  - [en](https://longbridge.com/en/news/284044418.md)
  - [zh-HK](https://longbridge.com/zh-HK/news/284044418.md)
---

# 全球首个开源医疗视频大语言模型正式发布

**\- 世界首个开源医学视频大语言模型发布，呼吁全球开发者共同推动**

, /PRNewswire/ -- 联影智能（UII）推出了 uAI NEXUS MedVLM，这是一种开创性的医学视频大规模语言模型，在临床环境中提供前所未有的空间和时间精度。

UII 已公开该模型的源代码，并为其在整个行业的评估引入了一个新的综合性基准。该研究已被 CVPR 2026 接受，这是人工智能领域的主要会议之一，突显了其在全球计算机视觉社区的认可。

继续阅读

该雷达图中显示的统计数据来自研究论文：https://arxiv.org/abs/2512.06581

image2

uAI NEXUS MedVLM 基于一个庞大的数据集，包含 531,850 对视频指令，涵盖 8 种临床场景，包括机器人手术、腹腔镜手术、内窥镜检查、开放手术和护理。

仅凭 4B/7B 参数，uAI NEXUS MedVLM 在医学视频的关键任务中显著超越了包括 GPT-5.4 和 Gemini 3.1 在内的主要通用基础模型。在外科安全评估中，其准确率达到 89.4%，而 GPT-5.4 为 1.8%，Gemini 3.1 为 10.1%。在时空动作定位方面，其 mIoU 比 GPT-5.4 高出 14 倍，比 Gemini 3.1 高出 4 倍。在视频报告生成中，其得分为 4.2（满分 5 分），大幅超越 GPT-5.4（2.5）和 Gemini 3.1（2.4）。

（来源：上述性能统计数据来自研究文章：https://arxiv.org/abs/2512.06581）

**发起全球开放挑战以加速协作创新**

为了推动医学视频大语言模型（LLM）的发展，UII 分阶段发布了其 MedVidBench 数据集，首批公开了 6,245 个严格的基准测试样本。该倡议涵盖八个不同的外科数据集，代表了全球范围内在规模和临床精度上的一个里程碑。

开发者可以在统一的分类中评估他们的模型，提案会与私有基准数据自动比较。结果会反映在一个持续更新的全球排名中，从而实现模型间的透明和可比性能评估。

UII 邀请全球的研究人员、开发者和医疗 AI 机构参与这一开放挑战，并通过协作创新推动医学视频领域的人工智能进步。

**项目页面：** https://uii-ai.github.io/MedGRPO/

**推动医学视频任务全谱的智能化**

医学视频的理解长期以来一直是人工智能最具挑战性的前沿之一，要求具备微观空间感知、复杂的时间逻辑和坚不可摧的临床精度。历史上，由于临床数据的严重短缺和专家标注的高昂成本，进展一直受到阻碍。

UII 已克服了这一障碍。通过设计一个大规模的逐帧标注框架，我们在各种临床视频中严格映射了关键属性：仪器轨迹、空间定位、精确的外科动作和关键风险指标。这一前所未有的数据库为 uAI NEXUS MedVLM 提供了一个全面而强大的临床智能平台。

基于这一基础，该模型完美地整合了感知、推理和决策。它提供高精度的仪器时空定位和程序自动识别，应用先进的推理将复杂的视频序列转化为结构化的临床报告、区域描述和快速工作流程摘要。超越被动观察，这些知识提升为主动决策，支持对下一步的预测、外科技能评估和安全风险的全面评估。

**将人工智能的创新转化为实际的临床影响**

uAI NEXUS MedVLM 旨在临床实施，能够在所有外科工作流程中实现更为明智的决策和基于数据的质量控制，同时降低医生的学习曲线，提高培训的效率和一致性。

展望未来，uAI NEXUS MedVLM 可以作为在物理世界中运作的集成 AI 的核心感知和认知引擎。两者共同形成一个闭环系统，结合视觉感知、认知推理和物理执行，朝着一个更加自动化、标准化和智能化的医疗生态系统迈进。

照片 - https://mma.prnewswire.com/media/2964990/image1.jpg

照片 - https://mma.prnewswire.com/media/2964989/image2.jpg

### 相关股票

- [688271.CN](https://longbridge.com/zh-CN/quote/688271.CN.md)

## 相关资讯与研究

- [联影宣布外科布局全面落地](https://longbridge.com/zh-CN/news/282194470.md)
- [联影医疗涨超 12%！3 款医疗器械进入创新通道，医疗器械 ETF 招商（159898）涨超 2.5%](https://longbridge.com/zh-CN/news/287160001.md)
- [拿下 4600 家医院客户！安得医疗冲刺港股，血管通路产品跻身全球第一梯队 | 港 E 声](https://longbridge.com/zh-CN/news/287042745.md)
- [佰泽医疗附属与美年大健康签署战略合作协议](https://longbridge.com/zh-CN/news/286739257.md)
- [民营医院多而不强，非公医疗 “老兵们” 重资产押注新赛道](https://longbridge.com/zh-CN/news/286813964.md)