商湯發佈 NEO 架構 料為行業首個實現深層次融合原生多模態架構

阿斯達克財經網
2025.12.03 03:42

商湯科技 (00020.HK) 宣佈正式發佈及開源與南洋理工大學 S-Lab 合作研發的全新多模態模型架構「NEO」,預期是行業首個可用的、實現深層次融合的原生多模態架構 (Native VLM),通過從底層原理出發,以「專為多模態而生」的創新設計,在核心架構層面進行多模態深層融合,實現性能、效率和通用性的整體突破,為日日新 SenseNova 多模態模型奠定新架構基礎,並標誌着 AI 多模態技術邁入「原生架構」的新時代。

商湯表示,NEO 架構以極致效率和深度融合為核心理念,通過在注意力機制、位置編碼和語義映射三個關鍵維度的底層創新,讓模型天生具備了統一處理視覺與語言的能力。此外,配合創新的 Pre-Buffer & Post-LLM 雙階段融合訓練策略,NEO 能夠在吸收原始 LLM 完整語言推理能力的同時,從零構建強大的視覺感知能力,解決傳統跨模態訓練中語言能力受損的難題。

商湯擬致力通過開源協作與場景落地雙輪驅動,將 NEO 打造為可擴展、可複用的下一代 AI 基礎設施,從而推動原生多模態技術從實驗室走向廣泛的產業化應用。