
賽道 Hyper | 通義千問萬億模型的戰略突圍解析

實用才是價值指向。
作者:周源/華爾街見聞
9 月 6 日凌晨,阿里巴巴旗下通義千問(Qwen)在其官網發佈 Qwen3-Max-Preview(Instruct)——一款參數量超過 1 萬億的預覽版超大型模型。
阿里對外稱,該模型在中英文理解、複雜指令遵循、工具調用(RAG/Tool-calling)等維度有明顯提升,並在設計上減少了知識幻覺現象;同時,Preview 版本已在 Qwen Chat 與阿里雲的模型平台上提供試用與 API 調用。
這個模型到底是什麼
阿里官方表述把 Qwen3-Max-Preview 定位為 Qwen3 系列中 “迄今為止最大且面向指令任務” 的模型,並強調兩件事:一是將 “指令遵循與工具調用” 作為主要優化目標;二是部署通道同時開放給自家產品(Qwen Chat)與商業開發者(阿里雲模型服務/百鍊平台)。
這兩個動作説明,這個超大模型既是產品宣稱,也是阿里推動模型即服務化的操作説明。
這個模型的亮點,集中在三個層面可被核驗的事實:參數規模(超過 1 萬億)、可通過雲平台與聊天產品調用、以及在若干公開或私有基準上取得的比較性優勢。
通義千問最近推出了多個不同側重的大模型,背後的思考是什麼?
阿里巴巴 CEO 吳泳銘(Eddie Wu)此前曾對外公開表示:“公司現在的主要目標,是構建一個最終能超越人類智能能力的——‘人工通用智能’(AGI:Artificial General Intelligence)系統。所有 Qwen3 模型均為開源,這體現了我們對開放社區與產業創新的長期承諾。”
這次,阿里為什麼把 “指令 + 工具” 放在首位?
通義團隊過去在 Qwen3 技術報告中提出的框架(如思考/非思考模式、混合密集與 MoE 架構、可控的思考預算機制)為 Max 版的演進提供了方法論基礎。
Qwen3 的技術路線不是簡單追參數,而是把 “模式切換”“預算分配”“多模態兼容” 作為可控變量,這使得放大到萬億參數時能更快面向實際任務做出靈活調整。
在 Max-Preview 的具體描述中,阿里把減少 “知識幻覺” 與增強 “工具調用” 並列為核心改進點:前者指向輸出可信度與事實性(對企業級應用至關重要),後者則直接關係到把大模型嵌入企業流程、調用檢索/數據庫/執行工具時的可靠性。
換言之,產品化路徑從 “更會説” 轉向 “更會做”(actionable),這是阿里把模型作為平台化產品推向市場的技術邏輯。
華爾街見聞注意到,近期,國內外多個廠商都推出了超大規模,或面向 AI Agent 的模型:比如 Moonshot(月之暗面)的 Kimi K2、DeepSeek 的 V3.1,以及國外的 Anthropic(Claude Opus)等。
這些模型在架構選擇(MoE vs Dense)、實際激活參數與峯值參數(Activated vs Total)、以及對 Agent/工具的內建支持等維度,都存在明顯差異。
Kimi 與若干國產團隊採取 MoE 路線以降低推理成本並提高單模型覆蓋面;DeepSeek 則強調混合推理模式(thinking/non-thinking)與國內生態的快速迭代;Anthropic 則把 AI Agent 與長期推理能力作為差異點。
對比之下,阿里這次選擇將 Max 以 “Instruct + 工具調用優化 + 可商用平台” 的方式先行投放,是一種強調可用性與生態接入的打法。
值得注意的是,參數的絕對值並不自動等同為產品優勢:MoE 類模型在 “總參數” 上能達到極大規模,但實際推理時的激活參數更小,成本結構不同——此次阿里沒有披露這個超大模型的參數激活量數據。
此外,開放策略(開源、預覽、閉源商用)會直接影響社區生態與二次創新速度。阿里在過去兩年裏已有 Qwen3 系列的開源實踐與社區積累,這決定了 Max 面向用户與開發者的出發點,與完全閉源的競品路徑存在本質差別。
阿里在賭實務可集成價值?
一個萬億級模型以 Preview 形式,在 Qwen Chat 與阿里雲平台上線,意味着阿里將該模型當作 “平台能力” 來推:企業可通過 API、RAG 流程與工具鏈把模型嵌進已有的比如客服、知識庫檢索、企業內網搜索和自動化代理等業務系統。
這一路徑的商業價值不在於單筆模型銷售,而在於通過平台帶來的長期黏性與增值服務,比如檢索、定製化 fine-tune、工具鏈託管和合規治理。
目前,阿里已有電商、金融、企業服務等場景可供切入,Max 作為 “更能調用工具、少幻覺” 的能力自有明確落地場景。
對於開發者與第三方廠商來説,Preview 版既是試金石也是門檻:試金能驗證 Max 在真實數據與業務流程中的表現;門檻則來自成本、接入複雜度與合規要求。
阿里若能在工具鏈穩定性、檢索可信度和接入模板上提供低成本的工程化支撐,便可把技術優勢轉化為生態優勢。
從近期業界的整體動態來看,大模型之爭,已從單個模型轉向整體系統的競爭。
阿里推出的 Qwen3-Max-Preview,實際上就是阿里在將 “大模型變成企業可用能力” 這一賽道上的一次明顯加壓。
9 月 5 日,華爾街見聞從國內一家服裝巨頭公司的 CIO 和 HR 總監處瞭解到,該公司已在阿里釘釘平台上,以釘釘自帶的 GenAI 全套工具,快速重構該公司的服裝從潮流趨勢確定到設計、到生產、到陳列、到銷售、到反饋、到售後等一系列業務流程。
這與阿里定位將 GenAI 技術以不同形式去重塑 B 端公司實務,達成吳泳銘所稱的 “產業創新” 策略,一脈相承。
這次推出的這個超大模型,也承襲了同樣的思路或策略:將焦點從單純的參數規模,轉向 “指令遵循、工具調用與降低幻覺” 的工程化可用性;同時通過 Qwen Chat 與阿里雲兩條通道快速聚攏用户與付費場景。
與此並行,業內以 Kimi、DeepSeek、Anthropic 為代表的不同路線,也在試圖用各自的架構、開放策略與商用策略佔據位置。
最終的優勝者,將不是參數最大者,而是能把模型能力在合規、工程化、生態與成本間實現平衡的一方。
若進一步檢驗 Qwen3-Max 的價值,需要時間與第三方評測來驗證其在複雜企業場景(長期對話、工具鏈調用、知識閉環)中的穩定性與成本效益。
同時,監管和平台治理將決定這類超大模型能否在更大規模的公眾與行業應用中長期存在。阿里這一步是加註,也是試探;真正的變量,在於生態能否被轉化為可持續的商業與治理能力。

