
商湯,跑出中國 AI 的「超速度」


商湯正在用自己的實際行動演繹着「苟日新,日日新,又日新」的真正內涵,它發佈的國內首個流式多模態交互大模型「日日新 5.5」,便是明證。
你很難想象在短短兩個月的時間內,商湯便有了如此巨大的進化。
要知道,早在兩個月之前,商湯發佈的「日日新 5.0」,還是國內首個對標 GPT-4 Turbo 的國產大模型。
現在,商湯帶着「日日新 5.5」強勢而來,再一次讓我們看到了中國原創 AI 的「超速度」。
6000 億參數基模型性能全面提升。大量使用合成高階思維鏈數據,提升推理思維能力,在數理邏輯、英文、指令跟隨等方面能力增強明顯。
率先推出國內首個 “所見即所得” 模型「日日新 5o」,流式多模態交互,帶來全新 AI 交互模式。
端側模型全面升級,發佈「日日新 5.5 Lite」,相比 4 月 5.0 版模型精度提升 10%,推理效率提升 15%,首包延遲降低 40%。
這些都是「日日新 5.5」的主要更新點。透過這些更新,我們不僅看到了商湯大模型進化的超級速度,同樣看到了它帶領中國原創 AI 抵達了一個新的制高點。
如果對商湯「日日新 SenseNova 5.5」進行定義的話,它是國內首個具備流式原生多模態交互能力大模型。
從兩個月前的首個對標 GPT-4 Turbo 的國產大模型到現在國內首個在交互效果和多項核心指標實現對標 GPT-4o,商湯再一次用實際行動演繹着 AI 的「超速度」。
致敬湯曉鷗,商湯給出「超速度」的底層答案
一切的進化,必然有一個原點;一切的表象,必然有一個答案。
如果一定要找到商湯跑出 AI「超速度」的內在答案的話,其在 AI 的賽場上堅持長期主義,秉持耐心主義,憑藉多年以來的技術積累和人才佈局,堅守原創,或許是最關鍵的那一個。
正是因為如此,商湯在發佈「日日新 5.5」之前,商湯董事長兼 CEO 徐立用商湯「可控」人物視頻生成大模型 Vimi 創作了一條視頻,致敬商湯科技創始人湯曉鷗老師。
正如商湯董事長兼 CEO 徐立所説的那樣,「如果沒有商湯長期以來的技術積累和人才佈局,或許就不會有今天的自己。」
或許,這才是商湯之所以會跑出 AI 的「超速度」的底層答案。
可以説,正是有了像湯曉鷗老師這樣的商湯人在 AI 的賽道上,不斷地堅持長期主義,不斷地進行前瞻性地佈局,今天的商湯才可以一次又一次的成為「首個」,並且演繹着中國原創 AI 的磅礴動能。
如果説,商湯的領軍者們為它的發展指明瞭方向的話,那麼,商湯本身的佈局,則讓它具備了一次又一次更新迭代的「硬實力」。
無論是從數據到算法、算力,還是從產品到行業、場景,商湯都在將 AI 的理想一步步照進現實。
海量的數據,強大的算法和算力,優質的產品體系和豐富的行業應用場景,成為了現在的商湯的真實寫照。
此次商湯日日新大模型,再度進化,更是讓我們看到了商湯的這些內在力量所外化出來的強大力量。
當我們站在這樣一個基點去看待商湯的進化,當我們站在這樣一個基點去尋找商湯「超速度」的答案,一切或許將會變得更加清晰而自然。
當我們站在這樣一個基點去看待「日日新 5.5」的多模態能力,便會找到它在核心測試集指標上對標甚至超過 GPT-4o 的答案。
「日日新 5.5」在數學推理、英文能力和指令跟隨等能力明顯增強,交互效果和多項核心指標實現對標 GPT-4o。


另外,「日日新 5.5」採用混合端雲協同專家架構,最大限度發揮雲邊端協同,降低推理成本,模型訓練基於超過 10TB tokens 高質量訓練數據,包括大量合成的思維鏈數據,提升推理思維能力。
顯而易見的是,「日日新 5.5」,正在成為新的技術基座。
同樣地,正是有了「日日新 5.5」這樣一個基座,商湯才有了在「日日新 5o」、「日日新 Lite」上的卓越表現。
自然而流暢,商湯讓 AI 所見即所得
當 AI 大模型行業的發展進入到深水區,創新交互模式,讓人們使用 AI 像使用互聯網一樣地簡單和輕鬆,成為了引領行業發展的關鍵。
商湯為我們用實際行動演繹 AI 的「超速度」的一個明證,便是其在創新交互模式上領先。
通過整合跨模態信息,基於聲音、文本、圖像和視頻等多種形式,「日日新 5o」帶來了實時的流式多模態 AI 交互體驗。
使用感受如同人類自己交流一樣直接,可以直接見你所見,理解你所需。
這種交互模式多任務適應性強,能夠在同一模型中自然處理多種任務,且根據不同上下文自適應調整行為和輸出。
從場景理解分析、物體信息描述、書籍圖文總結,甚至粗糙的簡筆畫、面部情緒,「日日新 5o」都能精準拿捏,絲滑交互,還能言語俏皮的與人做互動。
可以説,商湯「日日新 5o」帶來的是相當絲滑且自然的交互體驗,它真正讓人們在使用 AI 的時候,如同和真人對話一樣輕鬆和自然。
正是得益於商湯在創新交互模式上的領先,它讓人們像使用互聯網一樣使用 AI,變成了一個現實。
縱觀當下的 AI 大模型市場,能夠像商湯一樣提供如此自然且流暢的體驗的玩家,並不多。
商湯在現場的演示,為我們較為生動地展示了這一點。
從開始和工作人員俏皮地打招呼,到較為準確地判斷出工作人員所在的場地,再到隨便翻開一本書的任何一頁,「日日新 5o」便可以給出好的理解和總結,而非簡單意義上的識別。
可以説,商湯「日日新 5o」給我們帶來的,不僅是實時和快速,還包含了日常生活當中的自然和流暢。
有了如此順滑的體驗,人們使用 AI 不再是一個門檻相對較高的事情,而是一件相當自然和平常的事情。只有有了如此好的交互體驗,AI 才能真正像掃碼支付一樣輕鬆和自然。
當 AI 大模型市場的競爭進入到白熱化,特別是當越來越多的玩家開始追求商業上的完美閉環的時候,商湯「日日新 5o」用自己出類拔萃的創新交互模式拔得頭籌,再度向 GPT-4o 發起了強有力的挑戰。
端側模型再升級,商湯把價格打下來
AI 大模型想要真正飛入到尋常百姓家,必然需要藉助一個有一個的終端。
目前,商湯「日日新」端側模型已深入各個行業,與超過 150+ 客户啓動商業對接,覆蓋智能手機、平板電腦、VR 一體機、車載電腦、智能枱燈等諸多 IoT 設備部署應用。
現在,哪怕是一台智能枱燈,同樣可以與商湯 AI 大模型建立聯繫,實現協同。
這,其實得益於商湯推出的全面升級的端側模型「日日新 5.5 Lite」。
它的性能指標更優,推理速度更快,端側模型矩陣更完善。
「日日新 5.5 Lite」端側大語言模型「商量 SenseChat Lite-5.5」各維度全面升級,是目前綜合性能最好的端側模型。同時,配合端雲模式,既保障性能,又保障速度。

這,還不是最關鍵的。
商湯不僅實現了端側模型的再度升級,同樣還把端側大模型的價格打了下來。
每台設備 9.9 元/年的價格,讓每一個用户,每一台設備都可以輕鬆享受到商湯 AI 大模型帶來的絲滑體驗。
隨着商湯端側模型的不斷升級,它的產品同樣開始變得豐富與完善。
從商量 SenseChat 到小浣熊,從擬人對話大模型到金融、農業、文旅和醫療的大場景,商湯已經建立了足夠大的場景底座和足夠豐富的應用場景。
很顯然,如果沒有商湯在端側模型上的不斷升級,那麼,便不會有如此多的終端和場景可以落地。
在我看來,商湯用技術的不斷進化和進步,進一步摧毀 AI 大模型的價格壁壘,讓更多的人,更多的場景,可以享受到 AI 帶來的普惠,才是真正導致這一切出現的關鍵。
從這樣一個角度來看,商湯不僅跑出了技術進化的「超速度」,同樣還跑出了行業和場景落地的「超速度」。
結語
「苟日新,日日新,又日新」,商湯用自己的實際行動,為我們完美地詮釋了這一點。
當商湯一次又一次的「新」,匯聚在一起,於是,便產生了跑出「超速度」的強大能量,於是在短短兩個月的時間內,便有了新一輪的進化。
對於商湯來講,它,從國內首個對標 GPT-4 Turbo 的國產大模型,蜕變成為了國內首個對標 GPT-4o 的流式多模態交互大模型。
對於國內的 AI 大模型來講,商湯展現着叫板國外 AI 大模型頭部玩家的競技者的姿態。
可以説,商湯的一小步,引領着國內 AI 大模型的一大步。
正是有了像商湯這樣的中國原創 AI 的標杆性的存在,中國 AI,才能在世界 AI 的舞台上,始終保持一席之地和話語權。$商湯-W(00020.HK)
—完—
本文版權歸屬原作者/機構所有。
當前內容僅代表作者觀點,與本平台立場無關。內容僅供投資者參考,亦不構成任何投資建議。如對本平台提供的內容服務有任何疑問或建議,請聯絡我們。

