---
title: "全球首个用于医学视频的开源 LLM 已发布，全球开发者社区被号召进一步开发"
type: "News"
locale: "zh-CN"
url: "https://longbridge.com/zh-CN/news/284106617.md"
description: "联影智能（UII）推出了 uAI NEXUS MedVLM，这是全球首个开源的大型语言模型（LLM），专为医学视频设计，在临床环境中提供前所未有的空间和时间精度。该模型基于 531,850 对视频指令的数据集，在关键医学视频任务中显著超越了领先模型如 GPT-5.4 和 Gemini 3.1。UII 邀请全球的人工智能研究人员和开发者参与一个开放挑战，以推动医学视频智能的发展，首步是发布基准测试样本。该倡议旨在提升外科工作流程中的决策制定和质量控制"
datetime: "2026-04-26T09:33:58.000Z"
locales:
  - [zh-CN](https://longbridge.com/zh-CN/news/284106617.md)
  - [en](https://longbridge.com/en/news/284106617.md)
  - [zh-HK](https://longbridge.com/zh-HK/news/284106617.md)
---

# 全球首个用于医学视频的开源 LLM 已发布，全球开发者社区被号召进一步开发

，/PRNewswire/ -- 联影智能（UII）推出了 uAI NEXUS MedVLM，这是一个突破性的医疗视频大型语言模型，在临床环境中提供前所未有的空间和时间精度。

UII 将该模型完全开源，并推出了一个新的全面基准，用于行业评估。该研究成果已被 2026 年计算机视觉与模式识别会议（CVPR）接受，彰显了其在全球计算机视觉社区中的认可。

继续阅读

该雷达图中显示的统计数据来自研究论文：https://arxiv.org/abs/2512.06581

image2

uAI NEXUS MedVLM 基于一个庞大的数据集，包含来自 8 个临床场景的 531,850 个视频指令对，包括机器人手术、腹腔镜手术、内窥镜检查、开放手术和护理。

仅凭 4B/7B 参数，uAI NEXUS MedVLM 在重要的医疗视频任务中显著超越了领先的通用基础模型，包括 GPT-5.4 和 Gemini 3.1。它在评估手术安全性方面的准确率达到 89.4%，而 GPT-5.4 为 1.8%，Gemini 3.1 为 10.1%。在时空动作定位方面，其 mIoU 值比 GPT-5.4 高出多达 14 倍，比 Gemini 3.1 高出 4 倍。在生成视频报告方面，其得分为 4.2 分（满分 5 分），明显超过了 GPT-5.4（2.5 分）和 Gemini 3.1（2.4 分）。

（来源：上述性能统计数据来自研究论文：https://arxiv.org/abs/2512.06581）

**启动全球开放挑战以加速共同创新**

为了推动医疗视频 LLM 模型的发展，UII 已开始逐步发布其数据集 “MedVidBench”，首批开放源代码发布了 6,245 个经过严格审核的基准测试样本。该倡议涵盖了八个不同的手术数据集，在规模和临床精度上均为全球首创。

开发者可以在统一的排行榜上评估他们的模型，提交的贡献将根据私有参考数据自动进行评估。结果将反映在一个持续更新的全球排行榜上，提供不同模型的透明和可比的性能评估。

UII 邀请全球的 AI 研究人员、开发者和医疗机构参与这一开放挑战，通过协作创新推动医疗视频智能的发展。

**项目页面：** https://uii-ai.github.io/MedGRPO/

**在所有医疗视频任务中推动智能化**

理解医疗视频长期以来一直是人工智能面临的最大挑战之一——它需要微观的空间意识、复杂的时间逻辑和无可妥协的临床准确性。过去，进展受到临床数据严重匮乏和专家注释成本高昂的制约。

UII 克服了这一瓶颈。通过为多样化的临床视频开发一个全面的逐帧注释框架，我们严格捕捉了关键属性：器械轨迹、空间定位、精确的手术动作和关键风险指标。这一前所未有的数据基础为 uAI NEXUS MedVLM 提供了完整而强大的临床智能堆栈。

在此基础上，该模型无缝集成了感知、思考和决策。它提供了高精度的器械时空定位和自动化过程识别，并利用先进的推理将复杂的视频序列转化为结构化的临床报告、区域描述和快速工作流程摘要。超越被动观察，它将这些洞察提升为主动决策，支持对下一步的预测、手术能力的评估和全面的安全风险评估。

**将 AI 创新转化为临床实践中的效果**

uAI NEXUS MedVLM 旨在临床应用，能够在手术工作流程中实现更为明智的决策和数据驱动的质量控制，同时缩短临床医生的学习曲线，提高培训的效率和一致性。

展望未来，uAI NEXUS MedVLM 可以作为一个中心感知和认知引擎，为在物理世界中运作的具身 AI 提供支持。它们共同构成一个视觉感知、认知思维和物理执行的闭环系统，为更自动化、标准化和智能化的健康生态系统铺平道路。

照片 - https://mma.prnewswire.com/media/2964990/image1.jpg

照片 - https://mma.prnewswire.com/media/2964989/image2.jpg

### 相关股票

- [688271.CN](https://longbridge.com/zh-CN/quote/688271.CN.md)

## 相关资讯与研究

- [创新药龙头捷报频传，硬核创新夯实长期价值](https://longbridge.com/zh-CN/news/287145423.md)
- [联影宣布外科布局全面落地](https://longbridge.com/zh-CN/news/282194470.md)
- [LeCun 炮轰 Hinton：他认可 LLM 就是想摆烂退休了！](https://longbridge.com/zh-CN/news/286723278.md)
- [国产 GPU 组了个开源局，把 SGLang 等核心开发者都摇来了！](https://longbridge.com/zh-CN/news/286398171.md)
- [openJiuwen 社区开源新招：重磅发布 JiuwenSwarm，拉开群体智能 “养蜂” 序幕](https://longbridge.com/zh-CN/news/286759953.md)