腾讯混元深度思考模型 T1 正式版来了,吐字快、能秒回,解码速度提升 2 倍

华尔街见闻
2025.03.21 15:19
portai
我是 PortAI,我可以总结文章信息。

混元 T1 正式版沿用混元 Turbo S 架构,是工业界首次无损应用混合 Mamba 架构的超大型推理模型,在可比参数量下的解码性能高于行业 2 倍,首字秒出,吐字速度 60 至 80 token/秒,擅长超长文处理。在体现推理模型基础能力的公开基准测试中,混元 T1 达到业界领先水平,其中逻辑推理测试得分 93.1,高于 OpenAI 的 o1、GPT 4.5 和 DeepSeek 的 R1。