騰訊混元深度思考模型 T1 正式版來了,吐字快、能秒回,解碼速度提升 2 倍

華爾街見聞
2025.03.21 15:19
portai
我是 PortAI,我可以總結文章信息。

混元 T1 正式版沿用混元 Turbo S 架構,是工業界首次無損應用混合 Mamba 架構的超大型推理模型,在可比參數量下的解碼性能高於行業 2 倍,首字秒出,吐字速度 60 至 80 token/秒,擅長超長文處理。在體現推理模型基礎能力的公開基準測試中,混元 T1 達到業界領先水平,其中邏輯推理測試得分 93.1,高於 OpenAI 的 o1、GPT 4.5 和 DeepSeek 的 R1。