
阿里开源新一代千问 Qwen3.5-Plus 大模型 每百万 Token 最低 0.8 人民币
阿里巴巴 (09988.HK) 旗下阿里云宣布开源全新一代大模型千问 Qwen3.5-Plus,该模型总参数为 3,970 亿,激活仅 170 亿,性能预料超过万亿参数的 Qwen3-Max 模型,部署显存占用降低 60%,推理效率大幅提升,最大推理吞吐量可提升至高达 19 倍。目前千问 APP 及 PC 端已接入 Qwen3.5-Plus 模型,其 API 价格每百万 Token 低至 0.8 元人民币。
阿里云指,千问团队自研的门控技术已融入至千问 3.5 创新的混合架构,团队结合线性注意力机制与稀疏混合专家 MoE 模型架构,实现了 3,970 亿总参数激活仅 170 亿的极致模型效率。
同时千问 3.5 通过训练稳定优化以及多 Token 预测等系列技术,Qwen3.5 性能与 Qwen3-Max 模型持平,并进一步提升了推理效率。在常用的 32K 上下文场景中,千问 3.5 推理吞吐量可提升 8.6 倍;在 256K 超长上下文情况下,Qwen3.5 推理吞吐量最大提升至 19 倍,推理效率大幅提升。

