生成式 AI 之戰,誰能破局而出?

portai
我是 PortAI,我可以總結文章信息。

隨着騰訊的入局,國內生成式 AI 大模型賽道集齊 BAT 三大巨頭,競爭日趨白熱化。

4 月 14 日,騰訊雲發佈面向大模型訓練的新一代高性能計算集羣,搭載英偉達最新一代 H800 GPU,服務器互聯帶寬高達 3.2T,算力性能較上一代提升 3 倍,號稱目前國內性能最強的大模型計算集羣。

除了算力基礎設施,騰訊去年 6 月發佈混元大模型,微信也在去年 10 月發佈 WeML 大模型。在上月底的財報電話會議上,騰訊總裁劉熾平表示,對於騰訊整個業務來説,AI 及大模型是一個增長的擴大器。

在騰訊下場之前,百度、阿里和華為等公司已經先後落子這一領域。

3 月中旬,百度推出 “文心一言”;半個多月後,華為在一場行業峯會上披露了 “盤古” 大模型的研發及落地情況;4 月 11 日,阿里大模型 “通義千問” 高調亮相,未來將接入阿里全線業務。

與此同時,360、網易、知乎、科大訊飛、崑崙萬維等先後公佈自己的大模型;此前淡出中心舞台的王慧文和王小川重出江湖,迅速敲定數千萬美元的融資,正在四處招兵買馬。

掀起新技術浪潮的 AI 大模型,已經成為科技公司必須參加的一場大考。在 AI 領域深耕多年的商湯科技,也在本月交出自己的答卷。

Part 1 入局 AI 大模型 “馬拉松”

4 月 10 日,商湯公佈以 “大模型 + 大算力” 推進 AGI(通用人工智能)發展的戰略佈局,併發布 “日日新 SenseNova” 大模型體系,涵蓋自然語言處理、圖片視頻及 3D 內容生成、自動化數據標註、自定義模型訓練等多種大模型及能力。

其中,最引人關注的是 “商量 SenseChat”,一款千億級參數的自然語言處理大模型。在現場演示中,SenseChat 能夠結合上下文語境,流暢準確地回答各類問題,還具備超長文本理解能力,可以從複雜文檔中提取和概括信息,幫助開發者編程,提供個性化的健康諮詢等。

此外,商湯還展示了多款基於大模型體系的生成式 AI 模型及應用:“秒畫 SenseMirage” AI 內容創作社區平台可以根據文本生成圖片,擁有超 10 億參數,支持二次元、三次元等多種生成風格,最高支持 6K 分辨率,還可支持自行上傳數據集進行 finetune、自訓練等功能,定製訓練屬於自己風格的 LoRA 模型,顯著降低模型的訓練門檻;“如影 SenseAvatar” AI 數字人視頻生成平台僅需一段 5 分鐘的真人視頻素材,即可生成數字人分身;“瓊宇 SenseSpace” 和 “格物 SenseThings” 3D 內容生成平台能夠生成大模型 3D 場景和精細 3D 物件,為搭建元宇宙虛擬空間提供高效、低成本的工具。

秒畫 SenseMirage 可根據文本生成多種風格的高清圖片

AI 大模型是中國科技企業的又一塊兵家必爭之地。隨着 BAT 等互聯網公司,以及商湯、科大訊飛等 AI 老兵的入局,每個人都摩拳擦掌、躍躍欲試,準備大幹一場。

業內人士普遍認為,國產大模型與 GPT 至少有 2~3 年的差距。怎樣儘快趕上世界先進水平,是擺在大大小小玩家面前的命題。將這一命題拆解開來,最關鍵的是數據、算法和算力三大要素。

三要素中,算法的研發難度相對較低,且有眾多開源項目可作為參考,中國公司最容易縮短甚至抹平差距;但在數據和算力方面,想要拉近與 OpenAI 的距離要困難得多。它需要更漫長的積累沉澱,也需要企業持之以恆地拿出真金白銀,投入到 AI 相關的 “硬科技” 中。

這也意味着,大模型之爭不是一場停留在應用層面的百米賽跑,而是一場由綜合能力定勝負的馬拉松。誰能在數據和算力上建立壁壘,誰就有望率先踏入生成式 AI 的新時代,在新技術浪潮中吃到更多紅利。

Part 2 數據和算力,AI 大模型兩大根基

ChatGPT 之所以一鳴驚人、經受住了上億用户不同場景下的考驗,首先得益於 OpenAI 給它 “投餵” 了大量數據。

OpenAI 此前披露,為了 AI 像人類那樣流暢交談,研發人員給 GPT-3.5 提供多達 45TB 的文本語料,相當於 472 萬套中國 “四大名著”。這些語料的來源包括維基百科、網絡文章、書籍期刊等,甚至還將代碼開源平台 Github 納入其中。

豐富而龐大的語料庫,讓 ChatGPT 不僅能夠聊天、講故事,還會回答專業問題、幫學生寫作業、給碼農寫代碼。在一些讀寫測試中,ChatGPT 展現出來的能力不亞於高中生。

與之類似,商湯語言大模型 SenseChat 也使用了大量數據進行訓練,並充分考慮中文語境,能夠更好地理解和處理中文文本。在發佈會上,SenseChat 一問一答應對自如,甚至還能夠根據《專利法》答疑解惑,結合法條和最新資訊給出合理答案。

可以看出,足夠多、足夠豐富的數據,是生成式 AI 大模型的根基。商湯在這方面有自己的獨特優勢。

商湯的 AI 技術和產品已經在眾多領域得到應用,在長期實踐中,商湯積累了大量真實世界的高質量視覺數據,視覺信息可以轉化為更多結構化的表達,形成豐富的多模態語料庫,為大模型研發奠定基礎。正如商湯董事長兼 CEO 徐立所言,“商湯積累了大量視覺類信息,這類信息作為知識,輸入我們的多模態網絡中,會帶來完全不一樣的數據基礎。” 不斷增長的多模態數據池,讓商湯從源頭上建立了壁壘。

視覺大模型是商湯的核心技術突破點。早在 2019 年,商湯就發佈了 10 億參數的視覺大模型,2022 年擴大至 320 億參數,為迄今為止全球最大的視覺模型。而在自然語言處理、多模態和生成式 AI 大模型方面,商湯也已有產品落地。這些大模型的迭代生長和融合匯聚,最終造就了商湯 SenseNova 大模型體系。

除了海量數據,大算力是大模型的另一個根基。

AI 大模型所需要的計算量,大致上相當於參數量與數據量的乘積。而大模型之所以 “大”,就是因為參數眾多和數據量龐大。過去 5 年,AI 大模型的參數量幾乎每年提升一個數量級,例如 GPT-4 參數量是 GPT-3 的 16 倍,達到 1.6 萬億個;而隨着圖像、音視頻等多模態數據的引入,大模型的數據量也在飛速膨脹。

這意味着,想要玩轉大模型,必須擁有大算力。OpenAI 在生成式 AI 賽道上一騎絕塵,關鍵能力之一就是空前強大的算力底座。僅僅是為了跑出 GPT-3.5 模型,OpenAI 就使用了約 1 萬顆英偉達 GPU 來訓練。

商湯很早就開始建設自己的算力底座。2018 年前後,商湯就着手籌備大模型所需的算力、算法、數據等方面的工作;2022 年 1 月,造價數十億元的商湯人工智能計算中心(AIDC)交付使用,初始峯值算力達到 3740 Petaflops,已具備完整訓練萬億參數規模的大模型的能力。再加上數據層和模型層,商湯 AI 大裝置逐漸成型。

如今,商湯的 AI 大裝置 SenseCore,依靠 2.7 萬塊 GPU,其算力達到 5000 Petaflops,可支持 20 個千億參數超大模型同時訓練,並提供涵蓋數據、訓練工具、推理部署、性能優化一條龍的大模型基礎設施服務體系。

不過,AI 大裝置的效能如何,總算力並不是唯一指標。在日常應用中,AI 大裝置需要儘可能提高多卡並行狀態下的算力利用率,儘可能保持長時間穩定運行。目前,SenseCore 支持最大 4000 卡並行單任務訓練,實現了多卡並行狀態下的高算力利用率,還能持續 7 天以上不間斷穩定訓練。

此外,SenseCore 提供了模塊化、全鏈條的數據、訓練及推理能力,可實現百億級數據管理及檢索、人工標註服務,一鍵量化、一鍵部署、一鍵應用,實現大模型快速上線驗證。

自研自建的算力底座,為商湯在大模型領域施展手腳提供了舞台。

像 SenseCore 這樣的 AI 大裝置,其價值不僅體現在對於商湯現有大模型的支撐上,更指向未來發展。在源源不斷的數據澆灌下,AI 大裝置能夠以更高效、更經濟的方式批量訓練大模型,並縮短從研發到部署再到應用的鏈條,成為商湯大模型體系應用落地的推力引擎。

Part 3 政策指引行業發展,AI 大模型加速落地

目前,生成式 AI 大模型已經成為全球各國的關注焦點。作為下一代互聯網的關鍵基礎設施,中國科技行業正在積極自主研發大模型,而配套的監管政策也已在路上。

近日,國家網信辦發佈《生成式人工智能服務管理辦法(徵求意見稿)》。徵求意見稿指出,國家支持人工智能算法、框架等基礎技術的自主創新、推廣應用、國際合作,鼓勵優先採用安全可信的軟件、工具、計算和數據資源。

同時,徵求意見稿對於生成式 AI 產品及服務的提供者做出多項明確要求,包括遵守法律法規的要求,尊重社會公德、公序良俗等,為其發展路徑指明方向、劃定紅線。

上述文件有望成為國內生成式 AI 產業的首份監管文件。它在釋放鼓勵發展的積極信號的同時,也設置了一系列監管規則,目標是促進生成式 AI 的健康發展和規範應用。

各領域企業正在積極擁抱生成式 AI,利用新技術實現降本增效,並把 AI 能力輸出給第三方企業,勾勒出充滿想象空間的商業化圖景。

以阿里為例,除了通義千問接入阿里的所有產品外,阿里雲的 AI 能力和算力也已經在多個企業和機構落地,包括 OPPO、南方電網、復旦大學等。此外,吉利汽車、智己汽車、奇瑞新能源、毫末智行、太古可口可樂、波司登、掌閲科技等多家企業表示,將與阿里雲在大模型相關場景展開技術合作的探索和共創。

商湯最新發布的日日新 SenseNova 大模型體系,同樣應用於諸多行業和場景,目前已落地 20 多個業務場景。

比如,智能汽車是商湯長期佈局的賽道。2022 年,商湯智能汽車板塊量產交付數超 50 萬輛,新增定點數超 800 萬輛,覆蓋 30 多家車企的 80 多款車型。如今,隨着 SenseNova 大模型體系的推出,商湯正通過 AI 大模型進一步賦能自動駕駛和智能車艙的產品研發。

在本週的上海車展上,商湯展示了與 SenseNova 深入融合的絕影未來展示艙。在展示艙內,商量 SenseChat 可以與用户交流、推薦個性化內容,甚至自動提煉郵件信息,幫助節省閲讀時間,如果是兒童上車後還會自動推薦進入兒童模式;而秒畫 SenseMirage 能夠為用户自動生成各種風格的照片,為出行增添樂趣。

商湯絕影未來展示艙

藉助大模型能力,商湯實現了 BEV 環視感知在國內首批量產落地,還首創自動駕駛 GOP 感知體系。此外,商湯絕影通過大模型進行自動化數據標註和產品檢測,搭建的完整數據閉環體系,將模型迭代效率提升數百倍,目前已獲得知名車企的定點。

此外,在生物製藥領域,商湯與企業合作,利用 AI 大裝置為蛋白質結構大模型提供 AI 推理算力,併為蛋白質相互作用模型,提供研發平台及訓練算力,使得抗體篩選效率提升 60%。

商湯以 AI 賦能實體經濟的能力矩陣進一步擴充。SenseNova 一方面服務商湯自身業務,另一方面,向政企客户開放了多種 API(應用程序接口)。客户可根據自身需求調用 SenseNova 的各項 AI 技術能力,比如文本生成、圖片生成、視覺感知、標註服務等,從而低門檻、低成本、高效率地實現各類 AI 應用。

基於商湯大裝置和 SenseNova 大模型體系,商湯麪向行業提供 “大模型即服務(Model-as-a-Service)”,涵蓋自動化數據標註、自定義大模型訓練、模型增量訓練、模型推理部署、開發效率提升等多項能力。

可以説,商湯已經實現了 “技術 - 產品 - 應用” 的商業化內外雙循環。長期重注 AI 的商湯,正站在新一波技術革新的潮頭之上繼續前行。

本文版權歸屬原作者/機構所有。

當前內容僅代表作者觀點,與本平台立場無關。內容僅供投資者參考,亦不構成任何投資建議。如對本平台提供的內容服務有任何疑問或建議,請聯絡我們。