--- title: "全球首个用于医学视频的开源 LLM 已发布,全球开发者社区被号召进一步开发" type: "News" locale: "zh-CN" url: "https://longbridge.com/zh-CN/news/284106617.md" description: "联影智能(UII)推出了 uAI NEXUS MedVLM,这是全球首个开源的大型语言模型(LLM),专为医学视频设计,在临床环境中提供前所未有的空间和时间精度。该模型基于 531,850 对视频指令的数据集,在关键医学视频任务中显著超越了领先模型如 GPT-5.4 和 Gemini 3.1。UII 邀请全球的人工智能研究人员和开发者参与一个开放挑战,以推动医学视频智能的发展,首步是发布基准测试样本。该倡议旨在提升外科工作流程中的决策制定和质量控制" datetime: "2026-04-26T09:33:58.000Z" locales: - [zh-CN](https://longbridge.com/zh-CN/news/284106617.md) - [en](https://longbridge.com/en/news/284106617.md) - [zh-HK](https://longbridge.com/zh-HK/news/284106617.md) --- # 全球首个用于医学视频的开源 LLM 已发布,全球开发者社区被号召进一步开发 ,/PRNewswire/ -- 联影智能(UII)推出了 uAI NEXUS MedVLM,这是一个突破性的医疗视频大型语言模型,在临床环境中提供前所未有的空间和时间精度。 UII 将该模型完全开源,并推出了一个新的全面基准,用于行业评估。该研究成果已被 2026 年计算机视觉与模式识别会议(CVPR)接受,彰显了其在全球计算机视觉社区中的认可。 继续阅读 该雷达图中显示的统计数据来自研究论文:https://arxiv.org/abs/2512.06581 image2 uAI NEXUS MedVLM 基于一个庞大的数据集,包含来自 8 个临床场景的 531,850 个视频指令对,包括机器人手术、腹腔镜手术、内窥镜检查、开放手术和护理。 仅凭 4B/7B 参数,uAI NEXUS MedVLM 在重要的医疗视频任务中显著超越了领先的通用基础模型,包括 GPT-5.4 和 Gemini 3.1。它在评估手术安全性方面的准确率达到 89.4%,而 GPT-5.4 为 1.8%,Gemini 3.1 为 10.1%。在时空动作定位方面,其 mIoU 值比 GPT-5.4 高出多达 14 倍,比 Gemini 3.1 高出 4 倍。在生成视频报告方面,其得分为 4.2 分(满分 5 分),明显超过了 GPT-5.4(2.5 分)和 Gemini 3.1(2.4 分)。 (来源:上述性能统计数据来自研究论文:https://arxiv.org/abs/2512.06581) **启动全球开放挑战以加速共同创新** 为了推动医疗视频 LLM 模型的发展,UII 已开始逐步发布其数据集 “MedVidBench”,首批开放源代码发布了 6,245 个经过严格审核的基准测试样本。该倡议涵盖了八个不同的手术数据集,在规模和临床精度上均为全球首创。 开发者可以在统一的排行榜上评估他们的模型,提交的贡献将根据私有参考数据自动进行评估。结果将反映在一个持续更新的全球排行榜上,提供不同模型的透明和可比的性能评估。 UII 邀请全球的 AI 研究人员、开发者和医疗机构参与这一开放挑战,通过协作创新推动医疗视频智能的发展。 **项目页面:** https://uii-ai.github.io/MedGRPO/ **在所有医疗视频任务中推动智能化** 理解医疗视频长期以来一直是人工智能面临的最大挑战之一——它需要微观的空间意识、复杂的时间逻辑和无可妥协的临床准确性。过去,进展受到临床数据严重匮乏和专家注释成本高昂的制约。 UII 克服了这一瓶颈。通过为多样化的临床视频开发一个全面的逐帧注释框架,我们严格捕捉了关键属性:器械轨迹、空间定位、精确的手术动作和关键风险指标。这一前所未有的数据基础为 uAI NEXUS MedVLM 提供了完整而强大的临床智能堆栈。 在此基础上,该模型无缝集成了感知、思考和决策。它提供了高精度的器械时空定位和自动化过程识别,并利用先进的推理将复杂的视频序列转化为结构化的临床报告、区域描述和快速工作流程摘要。超越被动观察,它将这些洞察提升为主动决策,支持对下一步的预测、手术能力的评估和全面的安全风险评估。 **将 AI 创新转化为临床实践中的效果** uAI NEXUS MedVLM 旨在临床应用,能够在手术工作流程中实现更为明智的决策和数据驱动的质量控制,同时缩短临床医生的学习曲线,提高培训的效率和一致性。 展望未来,uAI NEXUS MedVLM 可以作为一个中心感知和认知引擎,为在物理世界中运作的具身 AI 提供支持。它们共同构成一个视觉感知、认知思维和物理执行的闭环系统,为更自动化、标准化和智能化的健康生态系统铺平道路。 照片 - https://mma.prnewswire.com/media/2964990/image1.jpg 照片 - https://mma.prnewswire.com/media/2964989/image2.jpg ### 相关股票 - [688271.CN](https://longbridge.com/zh-CN/quote/688271.CN.md) ## 相关资讯与研究 - [创新药龙头捷报频传,硬核创新夯实长期价值](https://longbridge.com/zh-CN/news/287145423.md) - [联影宣布外科布局全面落地](https://longbridge.com/zh-CN/news/282194470.md) - [LeCun 炮轰 Hinton:他认可 LLM 就是想摆烂退休了!](https://longbridge.com/zh-CN/news/286723278.md) - [国产 GPU 组了个开源局,把 SGLang 等核心开发者都摇来了!](https://longbridge.com/zh-CN/news/286398171.md) - [openJiuwen 社区开源新招:重磅发布 JiuwenSwarm,拉开群体智能 “养蜂” 序幕](https://longbridge.com/zh-CN/news/286759953.md)