
深扒 Minimax 與智譜:大模型,算力強度與融資耐力的絕殺?

26 年初 ChatGPT 發佈三年之際,中國兩大 AI 大模型創業公司$MINIMAX-WP(00100.HK) 和$智譜(02513.HK) 幾乎同時,均以大約 60 億美金的估值上市,且上市後都以暴漲,並帶動整個 AI 應用的普漲行情。但同時,扒開兩個大模型公司的報表,都是 “虧無止境” 的面相。
一邊是全球大模型瘋狂卷價格、越來越大宗商品,一邊是模型無底洞的研發投入,但同時還有這種即翻倍的盛景。冰火交織下,海豚君一直的疑問是大模型到底是一種什麼樣的生意。
這次,海豚君就結合兩個上市的公司數據,來認真探討一下這個問題:
1)大模型到底需要怎樣的投入要素和密度?
2)算力到底扮演了什麼角色?
3)模型經濟學如何算,才能平衡?
4)最終,大模型到底是怎樣的生意模式?
以下是正文:
一、拔高的收入、驚悚的投入
兩個大模型公司 Minimax 和智譜,都是 “短小精悍” 型——人手少、產品迭代快,收入增長快。人數到 2025 年下半年沒超一千人,收入零起步,兩三年年化收入都在快速邁向一億美金。
但到了支出層,再高增的收入都被兇猛的投入比得相形見絀:即使收入增長過程中,Model to B 公司智譜持續保持在 50% 的高毛利,還是 Model to C 公司 Minimax 毛利率翻正。
2024 年兩個公司的支出(成本與運營開支)加總基本在當期收入的 10 倍上下。Minimax 2025 年前九個月收入快速做大後支出仍然是收入的 5 倍以上;而智譜到了 2025 年上半年看起來反而更加規模不經濟了。
這裏的核心問題是,對於模型公司而言,到底收入越大、虧損率收窄,還是收入越大、虧損率越高的規模不經濟結局?
模型經濟學的底層三要素——數據、算力、算法,大家已耳熟能詳。但要解答模型到底適不適用互聯網規模經濟規模,關鍵是理解大模型到底需要怎樣的投入密度。
在大語言模型訓練中,用了什麼訓練數據從來沒有模型廠真正公開,但這個問題大致有這麼兩個共識; a.公共語料庫有百科、代碼庫、Common Crawl 語料庫等; b.但公共和標準語料庫幾乎已被模型訓練完畢。
到了 2026 年,大模型公司開始依賴合成數據和思維鏈數據。但未來,要給模型投餵更多數據,要麼靠自身超快的落地速度去接入更多場景;要麼大模型公司本有自有數據,比如説互聯網大廠更具數據優勢;剩下就是比拼對私有數據的付費能力。
但數據投餵量因涉及數據合規和隱私等,沒有模型廠會在報表中展示。真正能體現在報表端的,主要是算力和算法,算法的精進本質是靠腦力,算力對應的是芯片和雲服務。對於這兩個問題,我們就一個一個來看一下。
二、人太貴了?不是核心問題!
兩個公司員工整體都沒超 1000 人,尤其是 Minimax 都不足 400 人;兩家公司研發人員都接近 75%,單人頭月成本 6.5-8.5 萬元人民幣(不含期權激勵),其中 Minimax 研發人員單人月成本是 16 萬。
Minimax 因人員更為精煉,收入做大過程中,薪資支出至少已能夠收入覆蓋。而智譜因為商業變現上主要是 to B 落地,需要匹配更多銷售人員;而且研發上對通用模型着力更高,所以人力成本改善並不明顯。
其實,從這兩家公司可以看出,大模型在人力上的投入,更多是人才 “腦力” 密度的投入,而非人力密度的投入。甚至 Minimax 的人才密度,可能已經預示了 AI 時代互聯網公司的人力結構雛形:
少而精的大模型研發人才,大量其他的部門崗位都在被模型取代(Minimax 旗下 AI 產品眾多,但並未對應超大的人頭量),總體薪資呈現出單人薪資超高,但總體可控的狀態。
比如 Minimax 一年總薪資支出大約 1 億美金(大約收入的 90% 上下),考慮到這兩家公司基座模型的迭代能力和多模態的發佈速度、海外 AI 動輒上億美金的搶人戰慘烈程度(動輒挖一人開出的薪資就上億美金),這樣的人員支出還不算誇張。
三、核心矛盾:創收 vs 投入,到底能有平衡的時候嗎?
雖然薪資成本基本已把當期收入 “吃光了”,但相比於算力投入,人力薪資只是小菜一碟。薪資至少可以隨着收入的擴張而有效稀釋,但算力投入從兩家目前的情況看下來,是一個比收入增長斜率更高的投入類型。
而且從報表上來看,由於 Minimax 和智譜固定資產開支都非常少,幾乎可以確定,兩家公司的算力都是使用的第三方雲服務,這是一種相對輕資產的模式,而非 OpenAI 高度自控數據中心的方式。
大模型公司的報表中,算力的投入成本都分為了訓練算力和推理算力。
模型在訓練階段,等於是公司要做出來一個可以產生經濟效益的商品和服務之前,需要提前投入的研發支出。因此,在產品投用(模型進入推理場景)之前,對應的模型訓練支出,都是推出產品之前的 “沉澱支出”,計入研發費用當中。
而研發好的模型投入了推理使用場景中,產生的收益記為收入,而推理階段模型對於算力的消耗,就記為收入創造過程中的直接成本,記在成本項當中。
背後的邏輯也簡單:大模型公司砸人、砸算力、砸數據先在實驗室裏做模型的研發,這個是無論模型是否最終做出樣子,為客户所用,是模型公司都必須要做 “沉澱投入”。
只有當模型被研發出來,可以用到推理環節,無論是客户調用模型接口還是自己直接用模型做出來 APP 來產生收入,才會產生推理收入和推理計算的成本。
這 Minimax 和智譜兩家公司來看,為了研發模型,單單訓練算力投入全部佔到了總支出的 50% 以上,是開支的絕對大頭,也是妥妥的 “吸金黑洞”,貢獻了兩家公司5-10 倍虧損率中的一半以上的支出。
這一佔比,直接量化了海豚君在《AI 泡沫 “原罪”:英偉達是 AI 戒不掉的 “興奮劑”?》中所説的算力吸空產業鏈利潤的説法。
再拿收入創造和模型訓練投入相比,就更能直觀感受到訓練投入的強度了:
從 Minimax 來看,2024 年創收只有 23 年模型訓練算力投入的 65%,25 年前三季度雖然收入成長很快,但也對 24 年同期訓練算力成本覆蓋能力反而進一步降低到了 50%;智譜到 25 年上半年更是僅有 30% 的覆蓋率。
Minimax 由於產品落地上,以海外 to C 情感 AI 陪聊為主,設計上有很多遊戲和互聯網增值的變現模式(詳細產品和商業化落地會另外詳細分析),to C 的互聯網規模效應 + 海外付費能力較強,收入對訓練成本情況壓力尚小一些。
但智譜的情況就是一個非常明顯的收入高增,但模型創收對訓練成本的回收能力,因為訓練成本增長斜率更高,反而越來越弱。
這兩年趨勢看,雖然兩家作為中國獨立模型公司的佼佼者,收入增長斜率都很高,但當年創收對上一年研發投入的代償全都不盡如意。
模型要優秀,訓練成本就越高;收入跑得再快,也跟不上一代更比一代高的模型投入。那麼矛盾來了,模型越做越虧,這種生意如何理解商業價值?
四、大模型到底是怎樣的商業模式?
大模型動輒 1000% 的虧損率,再次形象地展示了大模型研發是一個人才 + 算力 + 數據三重密集的商業模式。
強投入和快迭代的共振,在海豚君看來,本質上是把一個強資產負債表的資本密集性業務,做成了 “全部攤在” 利潤表上的生意。
而當它具備長期的經濟和商業價值的時候,就是模型迴歸成真正的 “資產負債表” 業務——模型不再需要年年投,而是投一年的訓練成本可以讓模型在之後的 10 年甚至 20 年持續產生收入。這個時候,也就是一次模型訓練的成本可以做長期攤銷的時候,也只有這樣,模型研發的訓練成本才會有研發資本化的真正商業基礎。具體來看:
1)算力:節節高的 “固定資產投入”
Minimax 和智譜為例,23 年研發一代模型,訓練成本要四、五千萬美金之間; 而下一代模型的訓練要實現代際的線性差異,在數據量、模型參數量和算力投入反而是指數級的提升。最終算力效率提升,反而拉高了算力的總需求量。
從這兩家公司來看,模型升級一代,訓練成本基本要提高 3-5 倍。
當下大模型的競爭節奏,基本都是一年出一代模型。也就是説之前一年訓練出的模型,只對應接下來一年時間內的推理創收期。
這麼高的算力投入,沒有辦法做跨年的攤銷折舊,只能全部計入當期利潤表中的研發費用,結果就是上文高於收入 5-10 倍的虧損這種 “慘不忍睹” 的虧損率。
2)快迭代:收入 vs 投入,追不上的 “貓鼠遊戲”?
智譜和 Minimax 兩家公司面臨的共同情況都是,模型的創收能力尚且覆蓋無法模型的算力投入。雖然收入跑不過訓練成本,但一邊狂虧一邊狂投,幾乎是研發大模型必然的宿命。
為了讓自己活到黎明時刻,大模型公司要把這代模型的創收,如果再考慮上研發薪資支出,、再貼上高於收入 3-5 倍的融資資金,來為下一代的模型研發續命,以保證模型不被市場淘汰。
但這樣一直滾雪球下去,就是一個收入一直追不上未來投入;且只要還在大模型競爭的牌桌上,就需要不斷融資,而且越做大、融資窟窿越大的 “資本比拼” 遊戲。
3)縮放定律失效:資本遊戲結束?
一個自然而然的問題是,這麼下去,到底什麼時間才是個頭?很顯然,在成本端投入巨大的情況下,這裏矛盾的核心已不是簡單的收入成長速度能否匹配訓練成本增速的問題,更加重要的問題是,什麼時間模型不需要這麼大的投入,或者迭代速度不需要這麼快了。
對於大模型技術本身而言,不需要投入的時候,其實就是縮放定律(scaling law)失效的時候,換句話説,當增加一點點的智力所需要的算力開始暴漲式上升的時候,模型訓練的必要性就不大了。
模型不再需要高頻的訓練來迭代,就意味着高密集的訓練重資產投入告一段落,這個時候,把算力投入到一代新模型後,這代模型能有 10 年甚至更長的時間來創收。甚至當模型不再需要訓練投入,但大模型能夠一直創收,這時一個類似 “長江電力” 的商業模式也就呼之欲出了。
但這個假設的基本前提是,頭部大模型廠商在長期的資本、人力和數據消耗戰中,已經熬死了一眾對手,僅剩的幾個對手之間達成默契,不再打價格戰,最終形成類似當下雲服務市場一樣、市佔率高度集中的寡頭市場,那麼大模型的商業模式自然也就立住了。
4)終局之前,是殘酷的資本遊戲
但縮放定律失效時刻到來之前,大模型公司會是持續的吞金獸。這種情況下,商業模式的競爭本質上就變成了一場持續融資的資本競賽。
當然,如果像蔚來一樣,真有大模型公司能把融資做成一種差異化的生存能力,確實也是一項核心技能。但對於大多數公司而言,融資不是博傻遊戲,資金願意送錢,本身是要看企業的產品和執行能力。那些能融到資金且估值越來越高的大模型,本身也是一個雙向選擇的過程。
按媒體報道,中國的模型之戰,也已經從剛開始的百模之戰走到基模五強——字節、阿里、階躍、智譜和 DeepSeek。
原本的模型創業 “六小龍” 階躍、智譜、MiniMax、百川智能、月之暗面與零一萬物中,在 DeepSeek 一夜爆紅並用完全的開源開顛覆了模型收費之後,零一萬物和百川智能已經掉隊。
海外同樣也已經變成五虎爭霸:OpenAI、Anthropic、谷歌 Gemini、xAI 和 Meta Llama,甚至 Meta 的模型也已經落後。
一些能夠持續融資且估值能夠水漲船高、有一些在快速的死在了半路上。從大模型生存的路徑來看,融資能力背後真正的是核心人才、模型實力和產品落地進度能力綜合作用的結果。
核心人才是 AI 的上億美金搶人大賽,這個還是持續進行中。而另外兩個問題,一個看模型本身智能化程度,而另外一個最終要落地到創收能力上。
1)模型實力:
從下文可以看到,模型創業公司能生存下來,大多在模型的榜單上能找得到名字,這背後是模型在各個細分顆粒度上(模型智能化程度、幻覺率、模型參數、回答時首個 Token 輸出前的等待時長等)的競爭相對靠前。
2)產品落地能力
過去一年中,多數獨立創業公司,要麼在與互聯網大廠競爭中被挖走了人,要麼產品落地上創收困難,要麼是模型價格比拼中,幹不過性價比高的開源模型,模型倒在了半路上。
如果用一句話來概括的話,在 Scaling Law 撞牆的 “黎明時分” 之前,甚至到來之後的一段時間內,我們都會看到一個個模型在 “人才搶奪、模型研發和產品落地” 三維度的比拼中,一個個倒下去。
而真正能走向決賽的,除了看人和背後的資金實力,更加重要的是看模型研發的進度和產品落地的水平。
下一篇分析,海豚君就會圍繞智譜和 Minimax 的模型和產品落地,來理解如何去評價大模型的資本市場價值。
<此處結束>
本文的風險披露與聲明:海豚投研免責聲明及一般披露
相關文章:
本文版權歸屬原作者/機構所有。
當前內容僅代表作者觀點,與本平台立場無關。內容僅供投資者參考,亦不構成任何投資建議。如對本平台提供的內容服務有任何疑問或建議,請聯絡我們。

