阿里開源新一代千問 Qwen3.5-Plus 大模型 每百萬 Token 最低 0.8 人民幣

阿斯達克財經網
2026.02.23 01:21

阿里巴巴 (09988.HK) 旗下阿里雲宣佈開源全新一代大模型千問 Qwen3.5-Plus,該模型總參數為 3,970 億,激活僅 170 億,性能預料超過萬億參數的 Qwen3-Max 模型,部署顯存佔用降低 60%,推理效率大幅提升,最大推理吞吐量可提升至高達 19 倍。目前千問 APP 及 PC 端已接入 Qwen3.5-Plus 模型,其 API 價格每百萬 Token 低至 0.8 元人民幣。

阿里雲指,千問團隊自研的門控技術已融入至千問 3.5 創新的混合架構,團隊結合線性注意力機制與稀疏混合專家 MoE 模型架構,實現了 3,970 億總參數激活僅 170 億的極致模型效率。

同時千問 3.5 通過訓練穩定優化以及多 Token 預測等系列技術,Qwen3.5 性能與 Qwen3-Max 模型持平,並進一步提升了推理效率。在常用的 32K 上下文場景中,千問 3.5 推理吞吐量可提升 8.6 倍;在 256K 超長上下文情況下,Qwen3.5 推理吞吐量最大提升至 19 倍,推理效率大幅提升。