商湯何以跑出大模型落地的「逃逸速度」？

當商湯董事長兼 CEO 徐立在一面頗具中國風的背景面前發佈全新升級的「日日新 SenseNova 5.0」大模型體系，預示着商湯成為了首家實現了雲端邊全棧佈局的企業，而正是在這樣一面背景之上，赫然寫着「AI 大模型時代 II」。

於是，人們不禁會問，商湯何以跑出了大模型落地的「逃逸速度」，實現了大模型性能超越 GPT-4 Turbo 的呢？

如果我們對商湯日日新 5.0 大模型以及商湯背後強大的算力支撐，有一個全面的瞭解，便不會對此有任何的驚訝。

正如徐立所言，「商湯在尺度定律的指導下，會持續探索大模型能力的 KRE 三層架構（知識 - 推理 - 執行），不斷突破大模型能力邊界。」以此為基點，我們或許能夠找到商湯跑出大模型落地的「逃逸速度」的內在邏輯。

商湯日日新 5.0 性能全面超越 GPT-4 Turbo

自去年 4 月正式上線以來，商湯日日新大模型系統已經完成了五大版本的迭代升級。而此次升級，主要是基於超過 10TB tokens 訓練、覆蓋大量合成數據，採用混合專家架構，推理時上下文窗口可以有效到 200K 左右，以及聚集增強了知識、數學、推理及代碼能力，全面對標 GPT-4 Turbo，主流客觀評測上達到或超越 GPT-4 Turbo。

得益於這些更新，日日新 5.0 的「文科能力」、「理科能力」以及多模態能力，全面得到了一次質的提升。

以日日新 5.0 和 GPT-4 回答趣味推理問題為例：“媽媽給圓圓衝了一杯咖啡，圓圓喝了半杯後，將它加滿水，然後她又喝了半杯後，再加滿水，最後全部喝完。問圓圓喝的咖啡多，還是水多？”，日日新 5.0 回答正確，GPT-4 回答錯誤。

日日新 5.0 的這些能力的提升，可以在中文語境下，更好地為用户進行總結和問答，助力教育、內容等行業場景應用的落地。

同時，日日新 5.0 的數理能力、代碼能力以及推理能力的大幅度提升，同樣可以為金融、數據分析等場景的應用，提供有力支撐。

除了「文科能力」、「理科能力」之外，日日新 5.0 的多模態能力，同樣表現優異。它不僅支持高清長圖的解析和理解以及文生圖交互式生成，還可以實現複雜的跨文檔知識抽取及總結問答展示，還具備豐富的多模態交互能力。

商湯多模態大模型的圖文感知能力達到全球領先水平，在多模態大模型權威綜合基準測試 MMBench 中綜合得分排名首位，在多個知名多模態榜單 MathVista，AI2D，ChartQA，TextVQA，DocVQA，MMMU 取得領先成績。

可見，商湯日日新 5.0 在「文科能力」、「理科能力」以及多模態能力上的突出表現，為其更好地助力大模型場景落地打下了堅實的基礎。它不僅在主觀評測上全面達到或者超越了 GPT-4 Turbo，更加可以在中文環境下助力更多本土企業積極擁抱大模型時代帶來的紅利。

因此，如果我們要尋找商湯日日新 5.0 跑出大模型落地的「逃逸速度」的內在邏輯的話，文理兼修的全面發展以及多模態交互的卓越表現，無疑是最值得我們去關注的一個重要方面。

雲端邊全棧佈局，商湯打造大模型產品矩陣

隨着 AI 時代的來臨，特別是當中心化算力需求向端側擴展以及企業級邊側 AI 需求的不斷增加，只有實現雲、端、邊的高效協同，才能真正助力大模型的落地。

正是基於這樣一種認知，商湯在業內首次推出「雲、端、邊」全棧大模型產品矩陣，其中包括應用於終端設備的「商湯端側大模型」，以及面向金融、代碼、醫療、政務等多個領域的邊緣產品「商湯企業級大模型一體機」。

據悉，商湯日日新·端側大語言模型的推理速度達到了業內最快，可在中端平台實現 18.3 字/s 的平均生成速度，旗艦平台更是達到了 78.3 字/s。

擴散模型同樣可在端側實現業內最快的推理速度，端側 LDM-AI 擴圖技術在某主流平台上，推理速度小於 1.5 秒，比友商雲端 app 快 10 倍，支持輸出 1200 萬像素及以上的高清圖片，支持在端上快速進行等比擴圖、自由擴圖、旋轉擴圖等圖像編輯功能。

值得一提的是，為了滿足金融、代碼、醫療、政務等重點行業邊緣側日益增長的 AI 應用需求，商湯正式推出企業級大模型一體機，可同時支持企業級千億模型加速和知識檢索硬件加速，實現本地化部署，即買即用，降低企業應用大模型的門檻。相比行業同類產品，推理成本節約 80%，檢索大大加速，CPU 工作負載 50%。

得益於商湯在雲、端、邊的全棧佈局，商湯可以讓 AI 大模型在更多的企業落地，讓每一個企業的需求都能夠得到最大限度的滿足。

正因如此，

在辦公領域，商湯基於 “日日新” 大模型的卓越代碼生成及工具調用能力，助力 WPS 365 打造更高效釋放場景能力的辦公新質生產力平台，為企業構建專屬的 “企業大腦”。

在金融領域，海通證券與商湯科技聯合發佈金融行業多模態全棧式大模型，雙方在智能客服、合規風控、代碼輔助、展業辦公助手等領域助推業務落地，並共研智能投顧、輿情監控等行業前沿場景，打通證券行業大模型落地的全棧式能力。

在出行領域，基於商湯端雲大模型解決方案，小米小愛同學為車主提供智能化交互體驗。

可以預見的是，隨着商湯日日新 5.0 的雲、端、邊全棧佈局的不斷深入，我們還將會看到更多的企業在商湯的助力之下實現 AI 應用的快速落地，不斷地去擁抱 AI 時代來臨的紅利。

算力加持，商湯找到遵循「尺度定律」的路徑

無論是日日新 5.0 的全面升級，亦或是商湯基於雲端邊的全棧佈局，其實都離不開商湯打造的算力中心的加持與支撐。

正如商湯董事長兼 CEO 徐立所説的那樣，商湯持續尋求最有數據配比並建立數據質量評價體系，推動自身大模型研發的同時，也為行業夥伴提供大模型訓練、微調、部署和各類生成式 AI 的能力及服務。

在本次技術交流日最後環節，商湯科技董事長兼 CEO 徐立還帶來了三段完全由大模型生成的視頻，並強調文生視頻平台對於人物、動作和場景的可控性。

商湯科技在文生視頻平台方面也取得了技術突破，未來，通過輸入一段文字或一個完整的描述，就可以生成一段視頻，而且人物的服飾、髮型、場景都可以根據預先設定，保持視頻內容的連貫性和一致性。

不難看出，商湯的文生視頻，已經在路上了。

可以説，商湯找到了遵循「尺度定律」的路徑。

正是基於這樣一個全新的路徑，商湯才可以不斷地實現日日新 5.0 的升級，才可以打造了雲、端、邊的全棧佈局，才可以滿足越來越多的企業對於 AI 的新需求。

因此，如果我們要尋找商湯跑出大模型落地的「逃逸速度」的內在原因的話，商湯智能算力中心在背後的強大加持，無疑是最值得我們去關注的另外一個重要方面。

結語

從日日新 5.0 的知識、數學、推理及代碼能力，全面對標 GPT-4 Turbo，主流客觀評測上達到或超越 GPT-4 Turbo，到業內首次實現雲端邊全棧佈局，再到商湯對於合作伙伴的深度賦能，乃至是商湯對於 AGI 時代的全面擁抱，我們都可以看出，商湯着實跑出了大模型落地的「逃逸速度」。

當商湯日日新 5.0 的性能超越 GPT-4 Turbo，當商湯比 GPT-4 Turbo 更懂中國的消費者和企業，商湯無疑可以在 “尺度定律” 路徑逐漸清晰的時刻，實現一次彎道超車，助力 AI 在更多場景落地，真正實現算法、算力、數據、應用和場景的全面協同。$商湯-W(00020.HK)

—完—

作者：孟永輝，資深撰稿人，專欄作家，行業觀察家，知名 KOL。