
商汤发布 NEO 架构 料为行业首个实现深层次融合原生多模态架构
商汤科技 (00020.HK) 宣布正式发布及开源与南洋理工大学 S-Lab 合作研发的全新多模态模型架构「NEO」,预期是行业首个可用的、实现深层次融合的原生多模态架构 (Native VLM),通过从底层原理出发,以「专为多模态而生」的创新设计,在核心架构层面进行多模态深层融合,实现性能、效率和通用性的整体突破,为日日新 SenseNova 多模态模型奠定新架构基础,并标志着 AI 多模态技术迈入「原生架构」的新时代。
商汤表示,NEO 架构以极致效率和深度融合为核心理念,通过在注意力机制、位置编码和语义映射三个关键维度的底层创新,让模型天生具备了统一处理视觉与语言的能力。此外,配合创新的 Pre-Buffer & Post-LLM 双阶段融合训练策略,NEO 能够在吸收原始 LLM 完整语言推理能力的同时,从零构建强大的视觉感知能力,解决传统跨模态训练中语言能力受损的难题。
商汤拟致力通过开源协作与场景落地双轮驱动,将 NEO 打造为可扩展、可复用的下一代 AI 基础设施,从而推动原生多模态技术从实验室走向广泛的产业化应用。

