作者 | 黃昱、陳瑛羿編輯 | 周智宇過去一年,基礎大語言模型能力普遍提升、文生視頻大模型嶄露頭角,在朝着 AGI 前進的道路上,2025 年更多成熟的多模態大模型將進入市場。多模態的戰火愈演愈烈,穩坐全球遊戲頭把交椅的騰訊,正在瞄準遊戲研發需求很大的 3D 生成持續發力。1 月 21 日,騰訊正式推出並開源混元 3D 生成大模型 2.0 版本,還同步上線了業界首個一站式、低門檻 3D 內容 AI 創作平台——混元 AI 3D 創作引擎。交流會上,騰訊混元 3D 負責人郭春超表示,混元 AI 3D 創作引擎的價值在於,解決 3D 創作需求多,但普通人不會做,專業人士做的很慢的問題。“這也導致傳統 3D 模型的創作成本是很高的,一個 3D 模型最便宜要接近百元,貴的話 10 萬。”早在去年 11 月,騰訊就發佈且開源了混元 3D 生成大模型 1.0,支持企業及開發者精調和部署。僅僅時隔兩個月,騰訊又有大動作,這意味着,騰訊瞄準了 AI 3D 領域,要在此持續發力,爭當行業先鋒。對比 1.0 版本,混元 3D 生成大模型 2.0 版本也依然同時支持文、圖生 3D 的能力,不同的地方在於,通過將幾何、紋理解耦生成,2.0 版本在生成效果上得到顯著提升,在幾何結構上更加精細,紋理色彩更加豐富。據悉,3D 生成模型主要包括幾何和紋理生成兩部分,其中,幾何大模型專注於捕捉物體的形狀、結構和空間關係,而紋理大模型則專注於顏色、細節和表面特徵。這種專注性使得每個模型能在其領域內進行更深入的學習和優化,而幾何與紋理解耦生成的方式,讓整體生成能力達到更高上限,能夠生成更為精細和真實的 3D 結果。搭載 2.0 版本的 3D AI 創作引擎,可通過一句話、提示詞或圖片,直接生成 3D 模型。除了基礎模型生成外,該引擎還有 3D 功能矩陣、3D 編輯、3D 生成工作流、創作素材庫等多種功能。也就是説,這個 3D 內容 AI 創作平台具有 “低門檻、高效率” 的特徵,在助力遊戲開發、設計建模等專業領域的 3D 生產管線的同時,也可以支持普通愛好者生成 UGC 3D 內容。與很多大模型廠商不同,騰訊始終以 “產業實用” 作為發展大模型的核心戰略,而騰訊自身也有豐富的業務場景去實踐。騰訊混元大模型已經在騰訊內部超過 700 個業務場景中落地應用,混元 3D 生成大模型也已在騰訊的遊戲、社交、騰訊地圖、騰訊雲、機器人等多個業務場景內測。據悉,混元生成 3D 質量已能滿足部分遊戲 3D 資產標準,包括幾何佈線合理性、貼圖準確性與骨骼蒙皮合理性等,據統計,通過混元 3D 創作平台的助力,騰訊遊戲業務 3D 資產製作時間成本可從 5-10 天級別下降到分鐘級。遊戲研發無疑是 3D 模型應用的重要場景,混元 3D 生成大模型 2.0 版本則讓 3D 生成能真正應用到遊戲研發中去。騰訊遊戲在研項目研發製作人王智剛在交流會上指出,現在市面上 AI 生成 3D 模型應用於遊戲研發的主要挑戰,包括模型面數控制能力、佈線合理性、綁定骨骼的能力、蒙皮合理性等,這也導致絕大部分 AI 生成的 3D 模型不能應用到遊戲中去。混元 3D 生成大模型則在這些問題上有了明顯改善。就面數控制能力而言,王智剛表示,面數控制能力其實對遊戲研發來説是至關重要的,某些遊戲項目需要的 3D 模型可能只有幾千面,但一些大模型只能生成幾萬面,這就會導致遊戲跑不起來。“大家覺得如果不能做更高精度的模型好像顯得模型能力不夠強,但另一方面,如果在遊戲研發裏不能做面數控制更低的模型,其實也代表它能力不能行。”王智剛稱,騰訊混元團隊能深入紮根來理解遊戲整個研發的生產流程,所以能在理解真正痛點的情況下,會很剋制的關注遊戲研發的需求,而其它一些團隊可能不一定有這麼深的理解或關注,所以會跟業務應用之間還有脱節。在王智剛看來,混元 3D 生成大模型已經基本能滿足像微信小遊戲這樣的 3D 生成需求了。多模態是大模型領域下階段軍備賽的焦點,還有很大提升空間。郭春超指出,從技術而言,3D 和視頻的成熟度沒有到充分的拐點,因為發展的時間相對短一些,但視覺合格率僅用一年時間就從 20% 提升到 60% 的水平,發展非常快。但是相比於生文達到 95%,生圖達到 90% 以上的合格率,它的成熟度、可用性處在前半賽場。對於騰訊混元 3D 未來的發展方向,郭春超表示 2.0 的上限遠遠沒有達到,所以 “技術的方向一定是縱向深挖,橫向拓展”,但一年後的形態很難預料,就像大家以前沒有想到忽然跳出 sora 和 GPT-4o,所以技術方面,可能會從量變引發一個拐點。3D 生成大模型的發展還面臨不小挑戰。郭春超指出,一是數據的不足,只有千萬量級的數據,並且沒有被充分的利用。二是 3D 模型本身相對於別的模態約束比較少,比如視頻雖然也是橫向在時間軸上拓展,但是很少有突變,所以模型本身的技術挑戰比較大。多模態是大勢所趨。開源證券指出,國內外 AI 多模態大模型的持續突破及後續商業化,或大幅降低廣告、課件、短劇、動畫、劇集、電影等製作成本,提高 IP 開發、廣告營銷及教學效率,擴大商業化空間。3D 生成大模型的戰場已然十分火熱,前不久李飛飛創業公司 World Labs 展示了一圖生成 3D 世界的 AI 系統,字節、美團近日又聯手投資了 3D 生成大模型公司影眸科技。可以預見的是,3D 生成大模型將成為 2025 年的熱點之一。