小米最强语音大模型开源!亿小时训练,讲脱口秀说快板溜得很

华尔街见闻
2025.09.19 08:55
portai
我是 PortAI,我可以总结文章信息。

小米开源了其首个原生端到端语音模型 Xiaomi-MiMo-Audio,参数规模 70 亿,预训练数据超 1 亿小时,且在语音智能和音频理解基准测试中实现 SOTA。该模型具备流畅对话、音频字幕、音频推理等多种能力,能自然说天津方言,并具备语音续写能力。小米称其发布为 “语音闭源届的 GPT-3 时刻”。目前已开源多种模型和技术报告。