--- title: "DeepSeek V3.1 Base 突襲上線!擊敗 Claude 4 編程爆表,全網在蹲 R2 和 V4" description: "DeepSeek 官方發佈了全新 V3.1 版本,支持 128k 上下文長度,擁有 685B 參數,編程能力在開源模型中表現突出,Aider 編程基準測試得分 71.6%,超越 Claude Opus 4。新增原生搜索支持,去除「R1」標識,未來可能採用混合架構。每次編程任務成本僅為 1.01 美元,DeepSeek 粉絲數已破 8 萬,用户期待 R2 發佈。" type: "news" locale: "zh-HK" url: "https://longbridge.com/zh-HK/news/253732697.md" published_at: "2025-08-20T03:30:41.000Z" --- # DeepSeek V3.1 Base 突襲上線!擊敗 Claude 4 編程爆表,全網在蹲 R2 和 V4 > DeepSeek 官方發佈了全新 V3.1 版本,支持 128k 上下文長度,擁有 685B 參數,編程能力在開源模型中表現突出,Aider 編程基準測試得分 71.6%,超越 Claude Opus 4。新增原生搜索支持,去除「R1」標識,未來可能採用混合架構。每次編程任務成本僅為 1.01 美元,DeepSeek 粉絲數已破 8 萬,用户期待 R2 發佈。 就在昨晚,DeepSeek 官方悄然上線了全新的 V3.1 版本,上下文長度拓展到 128k。 本次開源的 V3.1 模型擁有 685B 參數,支持多種精度格式,從 BF16 到 FP8。 綜合公開信息和國內大咖 karminski3 的實測,V3.1 此次更新亮點有: - 編程能力:表現突出,根據社區使用 Aider 測試數據,V3.1 在開源模型中霸榜。 - 性能突破:V3.1 在 Aider 編程基準測試中取得 71.6% 高分,超越 Claude Opus 4,同時推理和響應速度更快。 - 原生搜索:新增了原生「search token」的支持,這意味着搜索的支持更好。 - 架構創新:線上模型去除「R1」標識,分析稱 DeepSeek 未來有望採用「混合架構」。 - 成本優勢:每次完整編程任務僅需 1.01 美元,成本僅為專有系統的六十分之一。 值得一提的是,官方羣中強調拓展至 128K 上下文,此前 V3 版本就已經支持。 對於這波更新,大家的熱情可謂是相當高漲。 即便還未公佈模型卡,DeepSeek V3.1 就已經在 Hugging Face 的趨勢榜上排到了第四。 DeepSeek 粉絲數已破 8 萬 看到這裏,網友們更期待 R2 的發佈了! ## **混合推理,編程擊敗 Claude 4** 這次最明顯的變化是,DeepSeek 在官方 APP 和網頁端上,把深度思考(R1)中的「R1」去掉了。 同時,與 V3-base 相比,DeepSeek V3.1 新增了四個特殊 Token: - <|search▁begin|> (id: 128796) - <|search▁end|> (id: 128797) - (id: 128798) - (id: 128799) 對此,有推測認為,這可能暗示推理模型與非推理模型的融合。 在編程方面,根據網友曝出的結果,DeepSeek V3.1 在 Aider Polyglot 多語言編程測試中拿下了 71.6% 高分,一舉擊敗了 Claude 4 Opus、DeepSeek R1。 而且,它的成本僅 1 美元,成為非推理模型中的 SOTA。 最鮮明的對比,V3.1 編程性能比 Claude 4 高 1%,成本要低 68 倍。 在 SVGBench 基準上,V3.1 實力僅次於 GPT-4.1-mini,遠超 DeepSeek R1 的實力。 在 MMLU 多任務語言理解方面,DeepSeek V3.1 毫不遜色於 GPT-5。不過在,編程、研究生級基準問答、軟件工程上,V3.1 與之有一定的差距。 一位網友實測,模擬六邊形中小球自由落體的物理測試,DeepSeek V3.1 理解力明顯提升。 ## 一手實測 第一時間,我們對 V3.1 進行了實測,首先是此次模型更新的重點:上下文長度。 假設對於中文而言,1 個 token ≈ 1–1.3 個漢字,那麼這 128K tokens ≈ 100,000–160,000 漢字。 相當於**整本《紅樓夢》正文(約 80–100 萬字)的 1/6–1/8**,或者一篇。 實際測試也很準確,DeepSeek 告訴我們它只能閲讀差不多 9%,也就是大約十分之一。 由於總結內容太長,我們截取了前三回,你覺得這個總結的怎麼樣? 在 128K 上下文測試中,DeepSeek-V3.1 輸出速度相比以往獲得較大提升,並且在工程上做了一些優化。 此次更新,DeepSeek 重點強調了對上下文的支持。 整個活,給 DeepSeek-V3.1 上點壓力,讓它根據「夢」這個字,輸出儘可能多的內容,儘量達到上下文極限。 不過最後,差不多隻輸出了 3000 字左右,模型就停止了輸出。 再來看下推理能力。 經典的 9.11 和 9.9 比大小問題,兩種詢問方式都能正確做答。 這次更新的一大體感還是速度變快了很多。 最後再來看看編程能力。 DeepSeek 的上一個模型是 R1-0528,主打的是編程能力。 看看這次 V3.1 是否有更大的提升。 最終結果只能説,打個 80 分吧,基本要求都滿足了,但是畫面風格和顏色變換功能並沒有完美實現。 並且和 R1-0528 的結果相比,兩者之間還是有些差距的,但孰好孰壞還需看個人偏好。 以下是開啓思考模式後的結果,你覺得哪個更好? 接下來,看看 DeepSeek V3.1 能否復刻出 GPT-5 發佈會上的法語學習小程序。 我們再來讓 V3.1 畫一個自己的 SVG 自畫像,兩種效果着實有些抽象。 風險提示及免責條款 市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用户特殊的投資目標、財務狀況或需要。用户應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資,責任自負。 ### Related Stocks - [DPSK.NA - 深度求索](https://longbridge.com/zh-HK/quote/DPSK.NA.md) ## Related News & Research | Title | Description | URL | |-------|-------------|-----| | OpenAI Warns Congress on DeepSeek Distillation Tactics | OpenAI has alerted US lawmakers about its Chinese competitor DeepSeek, which may be employing advanced distillation tact | [Link](https://longbridge.com/zh-HK/news/275935776.md) | | DeepSeek Reportedly Prepares New Flagship AI Model Ahead of Lunar New Year | DeepSeek is reportedly preparing to launch a new flagship AI model, referred to as “MODEL1,” as indicated by recent find | [Link](https://longbridge.com/zh-HK/news/273201414.md) | | BREAKINGVIEWS-OpenAI $100 bln mega-raise may be a mere pit stop | OpenAI is reportedly seeking over $100 billion in a fundraising round, potentially led by Amazon, SoftBank, and Nvidia, | [Link](https://longbridge.com/zh-HK/news/276437556.md) | | ConocoPhillips considers selling Permian assets worth $2 billion, Bloomberg News reports | Feb 20 (Reuters) - ConocoPhillipsis exploring a sale of some of its Permian Basin assets as part of a broader streamlini | [Link](https://longbridge.com/zh-HK/news/276478732.md) | | IronBridge Private Wealth LLC Has $905,000 Holdings in Apple Inc. $AAPL | IronBridge Private Wealth LLC reduced its stake in Apple Inc. (NASDAQ:AAPL) by 77.3% in Q3, holding 3,555 shares valued | [Link](https://longbridge.com/zh-HK/news/276436345.md) | --- > **免責聲明**:本文內容僅供參考,不構成任何投資建議。