--- title: "09:19 ET 全球首个开源医疗视频 LLM 发布,号召全球开发者社区进一步推动其发展" type: "News" locale: "zh-CN" url: "https://longbridge.com/zh-CN/news/284010603.md" description: "联影智能(UII)推出了 uAI NEXUS MedVLM,这是首个开源医疗视频大型语言模型,在高空间和时间精度的临床环境中表现出色。该模型基于 531,850 对视频指令的数据集构建,在各种医疗任务中超越了现有模型,如 GPT-5.4 和 Gemini 3.1。UII 发起了一项全球挑战,鼓励合作以推动医疗视频智能的发展,邀请开发者和研究人员参与。此项创新旨在提升医疗决策和培训效率,为更智能的医疗生态系统铺平道路" datetime: "2026-04-24T13:20:38.000Z" locales: - [zh-CN](https://longbridge.com/zh-CN/news/284010603.md) - [en](https://longbridge.com/en/news/284010603.md) - [zh-HK](https://longbridge.com/zh-HK/news/284010603.md) --- # 09:19 ET 全球首个开源医疗视频 LLM 发布,号召全球开发者社区进一步推动其发展 ,/PRNewswire/ -- 联影智能(UII)推出了 uAI NEXUS MedVLM,这是一种开创性的医疗视频大型语言模型,在临床环境中提供前所未有的空间和时间精度。 UII 将该模型完全开源,并引入了一项新的综合基准,用于行业范围内的评估。这项研究已被 2026 年计算机视觉与模式识别会议(CVPR 2026)接受,彰显了其在全球计算机视觉社区的认可。 继续阅读 该雷达图中显示的统计数据来自研究论文:https://arxiv.org/abs/2512.06581 uAI NEXUS MedVLM 建立在一个庞大的数据集上,该数据集包含 531,850 对视频 - 指令,涵盖 8 种临床场景,包括机器人手术、腹腔镜手术、内窥镜检查、开放手术和护理。 仅凭 4B/7B 参数,uAI NEXUS MedVLM 在关键医疗视频任务中显著超越了领先的通用基础模型,包括 GPT-5.4 和 Gemini 3.1。在外科安全评估中,其准确率达到 89.4%,而 GPT-5.4 为 1.8%,Gemini 3.1 为 10.1%。在时空动作定位中,其 mIoU 比 GPT-5.4 高出 14 倍,比 Gemini 3.1 高出 4 倍。在视频报告生成中,其得分为 4.2(满分 5 分),大幅超越了 GPT-5.4(2.5)和 Gemini 3.1(2.4)。 (来源:上述性能统计数据来自研究论文:https://arxiv.org/abs/2512.06581) **发起全球开放挑战以加速协作创新** 为了推动医疗视频 LLM 的发展,UII 已启动其 MedVidBench 数据集的分阶段发布,首批开放源代码发布 6,245 个严格的基准测试样本。涵盖八个多样化的外科数据集,这一举措在规模和临床精度上均为全球首创。 开发者可以在统一的排行榜上评估他们的模型,提交的结果会自动与私有真实数据进行评估。结果会反映在持续更新的全球排名中,使模型之间的性能评估透明且可比较。 UII 邀请全球的 AI 研究人员、开发者和医疗机构参与这一开放挑战,通过协作创新推动医疗视频智能的发展。 **项目页面:** https://uii-ai.github.io/MedGRPO/ **推动医疗视频任务全谱智能的发展** 医疗视频理解长期以来一直是人工智能中最具挑战性的前沿之一——需要微观的空间意识、复杂的时间逻辑和无可妥协的临床准确性。历史上,由于临床数据的严重匮乏和专家标注的高昂成本,进展一直受到阻碍。 UII 打破了这一瓶颈。通过在多样化的临床视频中构建一个庞大的逐帧标注框架,我们严格映射了关键属性:仪器轨迹、空间定位、精确的外科动作和重要的风险指标。这一前所未有的数据基础为 uAI NEXUS MedVLM 提供了完整、强大的临床智能堆栈。 基于这一基础,该模型无缝集成了感知、推理和决策。它提供了仪器的高精度时空定位和自动化程序识别,应用先进的推理将复杂的视频序列转化为结构化的临床报告、区域描述和快速工作流程摘要。超越被动观察,它将这些洞察提升为支持下一步预测、外科技能评估和全面安全风险评估的主动决策。 **将 AI 创新转化为现实世界的临床影响** 为临床部署而构建的 uAI NEXUS MedVLM 使得在外科工作流程中能够做出更明智的决策和数据驱动的质量控制,同时降低临床医生的学习曲线,提高培训效率和一致性。 展望未来,uAI NEXUS MedVLM 可以作为在物理世界中运作的具身 AI 的核心感知和认知引擎。它们共同形成一个视觉感知、认知推理和物理执行的闭环系统,朝着更自动化、标准化和智能化的医疗生态系统迈进。 来源:联影智能 ### 相关股票 - [688271.CN](https://longbridge.com/zh-CN/quote/688271.CN.md) ## 相关资讯与研究 - [LeCun 炮轰 Hinton:他认可 LLM 就是想摆烂退休了!](https://longbridge.com/zh-CN/news/286723278.md) - [反杀 Claude,Cursor“熹妃回宫”,Composer 2.5 降本打击](https://longbridge.com/zh-CN/news/287192113.md) - [瑞银:三大电讯商推 Token 套餐 带来新增长动力](https://longbridge.com/zh-CN/news/286873281.md) - [VLA 已死,WAM 当立:机器人的 GPT 时刻到了吗?](https://longbridge.com/zh-CN/news/287010129.md) - [谷歌 AI 的 14 年、Gemini 翻身之战,与视觉理解模型:专访 DeepMind 前核心科学家 Andrew Dai](https://longbridge.com/zh-CN/news/287023732.md)