高盛硅谷 AI 調研之旅:底層模型拉不開差距,AI 競爭轉向 “應用層”,“推理” 帶來 GPU 需求暴增

華爾街見聞
2025.08.25 03:23
portai
我是 PortAI,我可以總結文章信息。

高盛調研顯示,隨着開源與閉源基礎模型在性能上逐漸趨同,純粹的模型能力已不再是決定性的護城河,AI 原生應用如何建立護城河成為關鍵;以 OpenAI o3、Gemini 2.5 Pro 為代表的推理模型正成為 AI 領域的新前沿,這種計算範式的轉移,直接導致了 GPU 需求激增 20 倍,AI 基礎設施資本支出或將持續高企。

本文作者:李笑寅

來源:硬 AI

8 月 19 日至 20 日,高盛分析師團隊於完成第二屆硅谷 AI 實地調研,訪問了 Glean、Hebbia、Tera AI 等領先 AI 公司,以及 Lightspeed Ventures、Kleiner Perkins、Andreessen Horowitz 等頂級風投機構,並與斯坦福大學和加州大學伯克利分校教授進行深入交流。

調研顯示,隨着開源與閉源基礎模型在性能上迅速趨同,純粹的模型能力已不再是決定性的護城河。競爭的焦點正從基礎設施層全面轉向應用層,真正的壁壘在於能否將 AI 深度整合進特定工作流、利用專有數據進行強化學習,並建立穩固的用户生態。

報告還援引 Andreessen Horowitz 等頂級風投的觀點稱,開源基礎模型自 2024 年中期已在性能上追平閉源模型,達到 GPT-4 水平,而頂尖的閉源模型在基準測試上幾乎沒有突破性進展。

同時,以 OpenAI o3、Gemini 2.5 Pro 為代表的推理模型正成為生成式 AI 新前沿,其單次查詢生成的輸出 token 可達傳統模型的 20 倍,從而推動 GPU 需求激增 20 倍,並支撐着 AI 基礎設施資本支出在可預見的未來繼續保持高位。

基礎模型性能趨同,競爭焦點轉向應用層

高盛的調研明確指出,AI 領域的 “軍備競賽” 已不再僅僅圍繞基礎模型展開。

多位風險投資人表示,基礎模型的性能正日益商品化,競爭優勢正向上游轉移,集中在數據資產、工作流整合和特定領域的微調能力上。

Andreessen Horowitz 的合夥人 Guido Appenzeller 在交流中提到,開源大模型與閉源模型在性能上的差距在不到十二個月的時間內就被抹平,反映了開源社區驚人的發展速度。與此同時,頂尖閉源模型的性能自 GPT-4 發佈後幾乎停滯不前。

在這一背景下,AI 原生應用如何建立護城河成為關鍵。

AI 初創公司 Hebbia 認為,應用真正的壁壘並非技術本身——頂尖的工程團隊可以在 6 到 8 個月內複製任何技術——而在於用户習慣的培養和分銷渠道的建立。其邏輯類似於 Excel 的成功:通過深度嵌入工作流程和培養 “超級用户”,形成難以替代的網絡效應。

Everlaw 等公司也強調,通過將 AI 深度集成到法律案件的文檔處理流程中,為用户提供了一體化的便利和效率,這是獨立 AI 模型無法比擬的。

值得注意的是,前沿 AI 實驗室自身也意識到了這一轉變。報告稱,OpenAI、Anthropic 和 Google DeepMind 等機構正越來越多地涉足應用層,利用其對模型內部結構和發展路線圖的洞察力,來構建更緊密的產品反饋和強化學習循環,這給獨立的初創公司帶來了新的競爭壓力。

推理模型成新前沿,引爆 GPU 需求

報告數據顯示,在過去三年裏,運行一個達到恆定 MMLU 基準分數的模型成本從每百萬 token 60 美元降至 0.006 美元,降幅高達 1000 倍——儘管大模型的單位運行成本正在急劇下降。但這並不意味着整體算力支出會減少。

多位 VC 指出,新的需求增長點正迅速湧現。調研發現,繼 DeepSeek R-1 突破之後,出現了以 OpenAI o3、Gemini 2.5 Pro 和 Claude 4 Opus 為代表的新一代推理模型,這標誌着基礎模型的根本性轉變。

傳統大模型主要是複述記憶的答案,而推理模型則通過推導、驗證和迭代來模擬思維過程。這導致後者的輸出文本長度可達 1 萬個 token,而傳統 LLM 通常在 500 個 token 左右。而輸出 token 量 20 倍的增長,直接轉化為了對 GPU 推理算力 20 倍的需求。

高盛指出,這種轉變使得推理成本變得高昂,但也讓 AI 能更準確地應用於代碼合成、法律、金融和工程等需要嚴謹分析的複雜領域。因此,VC 們普遍認為,當前高昂的 AI 基礎設施資本支出是 “適當且必要的”,它不是利潤的威脅,而是獲取競爭優勢的先決條件,尤其對於頭部 AI 實驗室而言。

AI 原生應用護城河:工作流、數據與人才

隨着模型本身不再是稀缺資源,成功的 AI 應用公司正在通過其它方式構築壁壘。高盛的調研總結了以下幾大關鍵特徵:

一是工作流整合與用户生態。成功的應用公司能快速為企業創造價值,將部署時間從數月縮短至幾周。

例如,客户服務 AI 公司 Decagon 能幫助客户在 6 周內上線自動化客服系統,每投入 100 萬美元即可節省 300 至 500 萬美元成本。這種與現有業務流程的無縫對接是關鍵。

二是專有數據與強化學習。報告指出,靜態的 “圍牆花園” 式專有數據集在法律和金融等垂直領域價值巨大。

但比靜態數據更有價值的是動態的用户生成數據,它可以為強化學習循環提供動力。能夠儘早獲得規模化用户的公司,可以利用高質量的用户反饋信號來持續優化模型,從而形成滾雪球式的領先優勢。

三是專業人才的戰略價值。與上一代 SaaS 浪潮不同,生成式 AI 應用的成功高度依賴於頂尖工程人才。構建高效的 AI 系統需要模型封裝、智能體推理和強化學習迴路設計等專業技能。

VC 認為,能夠構建自我完善系統的 AI 人才極度稀缺,已成為可持續創新的主要瓶頸。