理解市场 | 阿里巴巴-W 高开逾 6% 发布开源推理模型 QwQ-32B 以 1/20 参数媲美 DeepSeek R1

智通财经
2025.03.06 01:31
portai
我是 PortAI,我可以总结文章信息。

阿里巴巴-W 高开逾 6%,截至发稿,涨 6.24%,报 138 港元,成交额 8.98 亿港元。消息面上,据 3 月 6 日市场消息报道,阿里巴巴发布并开源全新的推理模型通义千问 QwQ-32B,在数学、代码及通用能力上整体性能比肩 DeepSeek-R1,并降低了部署使用成本,在消费级显卡上也能实现本地部署。从 2023 年至今,阿里通义团队已开源 200 多款模型。据官方介绍,这款仅有 320 亿参数的模型在性能上不仅能够媲美拥有 6710 亿参数的 DeepSeek-R1(其中 370 亿被激活),更在某些测试中超越了对方。阿里 Qwen 团队表示,这一成果突显了将强化学习应用于经过大规模预训练的强大基础模型的有效性,希望以此证明强大的基础模型叠加大规模强化学习也许是一条通往通用人工智能的可行之路。

智通财经 APP 获悉,阿里巴巴-W(09988) 高开逾 6%,截至发稿,涨 6.24%,报 138 港元,成交额 8.98 亿港元。

消息面上,据 3 月 6 日市场消息报道,阿里巴巴发布并开源全新的推理模型通义千问 QwQ-32B,在数学、代码及通用能力上整体性能比肩 DeepSeek-R1,并降低了部署使用成本,在消费级显卡上也能实现本地部署。从 2023 年至今,阿里通义团队已开源 200 多款模型。

据官方介绍,这款仅有 320 亿参数的模型在性能上不仅能够媲美拥有 6710 亿参数的 DeepSeek-R1(其中 370 亿被激活),更在某些测试中超越了对方。阿里 Qwen 团队表示,这一成果突显了将强化学习应用于经过大规模预训练的强大基础模型的有效性,希望以此证明强大的基础模型叠加大规模强化学习也许是一条通往通用人工智能的可行之路。