機構:DeepSeek 會拉動總算力需求倍數提升

華爾街見聞
2025.02.07 09:26
portai
我是 PortAI,我可以總結文章信息。

DeepSeek 因 “服務器資源緊張” 突然暫停 API 服務充值,引發外界對其算力不足的猜測。分析認為,DeepSeek 可能難以滿足日益增長的需求,如果這種情況持續下去,DeepSeek 可能只能借鑑 OpenAI 的做法,加大對基礎設施的投資。

一夜爆紅後,新用户蜂擁而至,DeepSeek 可能算力吃緊了。

2 月 6 日週四,DeepSeek 突然暫停其 API 服務充值,按鈕顯示灰色不可用狀態。

隨後,DeepSeek 對此發表聲明稱,“當前服務器資源緊張,為避免對您造成業務影響,我們已暫停 API 服務充值。存量充值金額可繼續調用,敬請諒解!”

截至今早,DeepSeek 的 API 服務充值仍處於暫停狀態。這不禁引發外界猜測:難道是 DeepSeek 算力不夠了?

春節期間,DeepSeek 由於產品更新 “光速出圈”,其用户量在短時間內飆增。

據媒體援引國內 AI 產品榜統計數據,DeepSeek 應用上線 20 天,日活已經突破 2000 萬,DeepSeek 應用(不包含網站數據)上線 5 天內,日活已超 ChatGPT 上線同期日活,成為全球增速最快的 AI 應用。

根據國泰君安證券分析師舒迪、李奇的測算,假設 DeepSeek 的日均訪問量為 1 億次、每次提問 10 次,每次提問的回覆用到 1000 個 token,1000 個 token 大概對應 750 個英文字母,則 DeepSeek 每秒的推理算力需求為 1.6*1019TOPs。

在這種普通推理情境下, 假設 DeepSeek 採用的是 FP8 精度的 H100 卡做推理,利用率 50%,那麼推理端 H100 卡的需求為 16177 張,A100 卡的需求為 51282 張。

國泰君安進一步表示,在以 DeepSeek 為首的低成本推理模型的逐漸普及下,推理成本及價格大幅削減勢必會帶來應用測的繁榮,這反過來還會拉動成倍數的總算力需求提升。

有分析指出,隨着用户量持續增長,DeepSeek 可能難以滿足日益增長的需求。如果這種情況持續下去,DeepSeek 可能別無選擇,只能借鑑 OpenAI 的做法,加大對基礎設施的投資。

目前,DeepSeek 的部分 API 服務還處於優惠時間段內。

官方價目表顯示,deepseek-chat 模型優惠期至北京時間 2025 年 2 月 8 日 24:00,優惠結束後將按每百萬輸入 tokens 2 元,每百萬輸出 tokens 8 元計費。deepseek-reasoner 模型上線即按每百萬輸入 tokens 4 元,每百萬輸出 tokens 16 元計費。

原標題:DeepSeek 算力不夠了?