---
title: "DeepSeek V3.1 Base 突襲上線！擊敗 Claude 4 編程爆表，全網在蹲 R2 和 V4"
description: "DeepSeek 官方發佈了全新 V3.1 版本，支持 128k 上下文長度，擁有 685B 參數，編程能力在開源模型中表現突出，Aider 編程基準測試得分 71.6%，超越 Claude Opus 4。新增原生搜索支持，去除「R1」標識，未來可能採用混合架構。每次編程任務成本僅為 1.01 美元，DeepSeek 粉絲數已破 8 萬，用户期待 R2 發佈。"
type: "news"
locale: "zh-HK"
url: "https://longbridge.com/zh-HK/news/253732697.md"
published_at: "2025-08-20T03:30:41.000Z"
---

# DeepSeek V3.1 Base 突襲上線！擊敗 Claude 4 編程爆表，全網在蹲 R2 和 V4

> DeepSeek 官方發佈了全新 V3.1 版本，支持 128k 上下文長度，擁有 685B 參數，編程能力在開源模型中表現突出，Aider 編程基準測試得分 71.6%，超越 Claude Opus 4。新增原生搜索支持，去除「R1」標識，未來可能採用混合架構。每次編程任務成本僅為 1.01 美元，DeepSeek 粉絲數已破 8 萬，用户期待 R2 發佈。

就在昨晚，DeepSeek 官方悄然上線了全新的 V3.1 版本，上下文長度拓展到 128k。

本次開源的 V3.1 模型擁有 685B 參數，支持多種精度格式，從 BF16 到 FP8。

綜合公開信息和國內大咖 karminski3 的實測，V3.1 此次更新亮點有：

-   編程能力：表現突出，根據社區使用 Aider 測試數據，V3.1 在開源模型中霸榜。
-   性能突破：V3.1 在 Aider 編程基準測試中取得 71.6% 高分，超越 Claude Opus 4，同時推理和響應速度更快。
-   原生搜索：新增了原生「search token」的支持，這意味着搜索的支持更好。
-   架構創新：線上模型去除「R1」標識，分析稱 DeepSeek 未來有望採用「混合架構」。
-   成本優勢：每次完整編程任務僅需 1.01 美元，成本僅為專有系統的六十分之一。

值得一提的是，官方羣中強調拓展至 128K 上下文，此前 V3 版本就已經支持。

對於這波更新，大家的熱情可謂是相當高漲。

即便還未公佈模型卡，DeepSeek V3.1 就已經在 Hugging Face 的趨勢榜上排到了第四。

DeepSeek 粉絲數已破 8 萬

看到這裏，網友們更期待 R2 的發佈了！

## **混合推理，編程擊敗 Claude 4**

這次最明顯的變化是，DeepSeek 在官方 APP 和網頁端上，把深度思考（R1）中的「R1」去掉了。

同時，與 V3-base 相比，DeepSeek V3.1 新增了四個特殊 Token：

-   <｜search▁begin｜> (id: 128796)
-   <｜search▁end｜> (id: 128797)
-   (id: 128798)
-   (id: 128799)

對此，有推測認為，這可能暗示推理模型與非推理模型的融合。

在編程方面，根據網友曝出的結果，DeepSeek V3.1 在 Aider Polyglot 多語言編程測試中拿下了 71.6% 高分，一舉擊敗了 Claude 4 Opus、DeepSeek R1。

而且，它的成本僅 1 美元，成為非推理模型中的 SOTA。

最鮮明的對比，V3.1 編程性能比 Claude 4 高 1%，成本要低 68 倍。

在 SVGBench 基準上，V3.1 實力僅次於 GPT-4.1-mini，遠超 DeepSeek R1 的實力。

在 MMLU 多任務語言理解方面，DeepSeek V3.1 毫不遜色於 GPT-5。不過在，編程、研究生級基準問答、軟件工程上，V3.1 與之有一定的差距。

一位網友實測，模擬六邊形中小球自由落體的物理測試，DeepSeek V3.1 理解力明顯提升。

## 一手實測

第一時間，我們對 V3.1 進行了實測，首先是此次模型更新的重點：上下文長度。

假設對於中文而言，1 個 token ≈ 1–1.3 個漢字，那麼這 128K tokens ≈ 100,000–160,000 漢字。

相當於**整本《紅樓夢》正文（約 80–100 萬字）的 1/6–1/8**，或者一篇。

實際測試也很準確，DeepSeek 告訴我們它只能閲讀差不多 9%，也就是大約十分之一。

由於總結內容太長，我們截取了前三回，你覺得這個總結的怎麼樣？

在 128K 上下文測試中，DeepSeek-V3.1 輸出速度相比以往獲得較大提升，並且在工程上做了一些優化。

此次更新，DeepSeek 重點強調了對上下文的支持。

整個活，給 DeepSeek-V3.1 上點壓力，讓它根據「夢」這個字，輸出儘可能多的內容，儘量達到上下文極限。

不過最後，差不多隻輸出了 3000 字左右，模型就停止了輸出。

再來看下推理能力。

經典的 9.11 和 9.9 比大小問題，兩種詢問方式都能正確做答。

這次更新的一大體感還是速度變快了很多。

最後再來看看編程能力。

DeepSeek 的上一個模型是 R1-0528，主打的是編程能力。

看看這次 V3.1 是否有更大的提升。

最終結果只能説，打個 80 分吧，基本要求都滿足了，但是畫面風格和顏色變換功能並沒有完美實現。

並且和 R1-0528 的結果相比，兩者之間還是有些差距的，但孰好孰壞還需看個人偏好。

以下是開啓思考模式後的結果，你覺得哪個更好？

接下來，看看 DeepSeek V3.1 能否復刻出 GPT-5 發佈會上的法語學習小程序。

我們再來讓 V3.1 畫一個自己的 SVG 自畫像，兩種效果着實有些抽象。

風險提示及免責條款

市場有風險，投資需謹慎。本文不構成個人投資建議，也未考慮到個別用户特殊的投資目標、財務狀況或需要。用户應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資，責任自負。

### Related Stocks

- [DPSK.NA - 深度求索](https://longbridge.com/zh-HK/quote/DPSK.NA.md)

## Related News & Research

| Title | Description | URL |
|-------|-------------|-----|
| OpenAI Warns Congress on DeepSeek Distillation Tactics | OpenAI has alerted US lawmakers about its Chinese competitor DeepSeek, which may be employing advanced distillation tact | [Link](https://longbridge.com/zh-HK/news/275935776.md) |
| DeepSeek Reportedly Prepares New Flagship AI Model Ahead of Lunar New Year | DeepSeek is reportedly preparing to launch a new flagship AI model, referred to as “MODEL1,” as indicated by recent find | [Link](https://longbridge.com/zh-HK/news/273201414.md) |
| BREAKINGVIEWS-OpenAI $100 bln mega-raise may be a mere pit stop | OpenAI is reportedly seeking over $100 billion in a fundraising round, potentially led by Amazon, SoftBank, and Nvidia,  | [Link](https://longbridge.com/zh-HK/news/276437556.md) |
| ConocoPhillips considers selling Permian assets worth $2 billion, Bloomberg News reports | Feb 20 (Reuters) - ConocoPhillipsis exploring a sale of some of its Permian Basin assets as part of a broader streamlini | [Link](https://longbridge.com/zh-HK/news/276478732.md) |
| IronBridge Private Wealth LLC Has $905,000 Holdings in Apple Inc. $AAPL | IronBridge Private Wealth LLC reduced its stake in Apple Inc. (NASDAQ:AAPL) by 77.3% in Q3, holding 3,555 shares valued  | [Link](https://longbridge.com/zh-HK/news/276436345.md) |

---

> **免責聲明**：本文內容僅供參考，不構成任何投資建議。