AI 竞赛激烈，小米也加入战局！
4 月 30 日，小米推出专注推理能力的开源大模型 MiMo，仅用 7B 参数规模在数学推理和代码竞赛测评中超越 OpenAI 的闭源模型 o1-mini 以及阿里 32B 规模的 QwQ。
据小米介绍，Xiaomi MiMo 诞生之初探索的核心问题就是激发模型推理潜能，这款模型联动预训练到后训练，全面提升推理能力。
国内外 AI 竞争日趋白热化，本周阿里前脚发布 Qwen 3，马斯克后脚就官宣 Grok 3.5。而据此前媒体报道，小米正在建设万卡 GPU 集群，并引入顶尖 AI 人才，显示出对大模型领域的全面投入。
<h2 style="text-align: left">性能突破：小参数量实现大能力</h2>
Xiaomi MiMo 这款模型最引人注目之处在于，在数学推理（AIME 24-25）和 代码竞赛（LiveCodeBench v5）公开测评集上，MiMo 仅用 7B 的参数规模，超越了 OpenAI 的闭源推理模型 o1-mini 和阿里 Qwen 更大规模的开源推理模型 QwQ-32B-Preview。
<img class=" wscnph" src="https://imageproxy.pbkrs.com/https://wpimg-wscn.awtmt.com/ebee481e-e162-4f77-b7bd-06fff4b39c52.png?x-oss-process=image/auto-orient,1/interlace,1/resize,w_1440,h_1440/quality,q_95/format,jpg" width="663" height="418" original-src="https://imageproxy.pbkrs.com/https://wpimg-wscn.awtmt.com/ebee481e-e162-4f77-b7bd-06fff4b39c52.png"/>
 
更值得注意的是，在相同强化学习 (RL) 训练数据条件下，MiMo-7B 在数学和代码领域展现出的强化学习潜力明显领先于业界广泛使用的其他模型，包括 DeepSeek-R1-Distill-7B 和 Qwen2.5-32B 等知名强化学习起步模型。
<img class=" wscnph" src="https://imageproxy.pbkrs.com/https://wpimg-wscn.awtmt.com/c81e0918-0eb4-465e-8a29-a6e46ab75b3d.png?x-oss-process=image/auto-orient,1/interlace,1/resize,w_1440,h_1440/quality,q_95/format,jpg" width="531" height="521" original-src="https://imageproxy.pbkrs.com/https://wpimg-wscn.awtmt.com/c81e0918-0eb4-465e-8a29-a6e46ab75b3d.png"/>
<img class=" wscnph" src="https://imageproxy.pbkrs.com/https://wpimg-wscn.awtmt.com/f50ce5fe-e7e7-464b-900c-e9e93ea2592f.png?x-oss-process=image/auto-orient,1/interlace,1/resize,w_1440,h_1440/quality,q_95/format,jpg" width="441" height="444" original-src="https://imageproxy.pbkrs.com/https://wpimg-wscn.awtmt.com/f50ce5fe-e7e7-464b-900c-e9e93ea2592f.png"/>
 
<h2 style="text-align: left">技术关键：预训练与后训练双轮驱动</h2>
据小米介绍，MiMo 模型的成功并非偶然，而是来自于预训练和后训练两个阶段的多层面创新。
在预训练阶段，小米团队着重挖掘富含推理模式的语料，并合成了约 200B tokens 的推理数据。训练过程采用三阶段策略，逐步提升训练难度，累计训练了 25T tokens，这一训练量在同等规模模型中处于领先水平。
<img class=" wscnph" src="https://imageproxy.pbkrs.com/https://wpimg-wscn.awtmt.com/979049ab-2262-4264-a41a-a7b6142dd1dd.png?x-oss-process=image/auto-orient,1/interlace,1/resize,w_1440,h_1440/quality,q_95/format,jpg" width="528" height="134" original-src="https://imageproxy.pbkrs.com/https://wpimg-wscn.awtmt.com/979049ab-2262-4264-a41a-a7b6142dd1dd.png"/>
后训练阶段的创新更为关键，小米团队提出了&#34;Test Difficulty Driven Reward&#34;机制，有效解决了困难算法问题中奖励稀疏的问题。同时引入&#34;Easy Data Re-Sampling&#34;策略，显著提升了强化学习训练的稳定性。在框架层面，他们设计了&#34;Seamless Rollout&#34;系统，使得强化学习训练速度提升 2.29 倍，验证速度提升 1.96 倍。
<img class=" wscnph" src="https://imageproxy.pbkrs.com/https://wpimg-wscn.awtmt.com/a5e0bb1c-7a6f-4a1c-b778-022decf42835.png?x-oss-process=image/auto-orient,1/interlace,1/resize,w_1440,h_1440/quality,q_95/format,jpg" width="560" height="376" original-src="https://imageproxy.pbkrs.com/https://wpimg-wscn.awtmt.com/a5e0bb1c-7a6f-4a1c-b778-022decf42835.png"/>
<h2 style="text-align: left">技术之外：小米的 AI 全面投入战略</h2>
据界面新闻报道，小米正在搭建自己的 GPU 万卡级集群，将对 AI 大模型进行大力投入。一名知情人士透露，该计划已经实施数月之久，小米创始人雷军亲自参与领导。该人士强调：&#34;在 AI 硬件这件事情上，最核心的是手机而不是眼镜，小米在这个领域不'all in'是不可能的。&#34;
小米的 AI 人才布局也在加速。12 月 20 日，第一财经报道称 DeepSeek 开源大模型 DeepSeek-V2 的关键开发者之一罗福莉将加入小米，或供职于小米 AI 实验室，领导小米大模型团队。罗福莉是 MLA（Multi-head Latent Attention）技术的核心开发者之一，该技术在降低大模型使用成本上发挥了关键作用。
<h2>小米 MiMo 引爆期待：AI 赋能米家生态？</h2>
网友纷纷表达了对 Xiaomi MiMo 的期待。
在社交平台 X 上，有网友表示：
<blockquote>
“米家很多东西还挺适合弄一个小型的 AI 可编程中枢的。AI 家庭总线”。
<img class=" wscnph" src="https://imageproxy.pbkrs.com/https://wpimg-wscn.awtmt.com/67eb707f-8d5f-46db-9147-374f12e08477.png?x-oss-process=image/auto-orient,1/interlace,1/resize,w_1440,h_1440/quality,q_95/format,jpg" width="898" height="389" original-src="https://imageproxy.pbkrs.com/https://wpimg-wscn.awtmt.com/67eb707f-8d5f-46db-9147-374f12e08477.png"/>
</blockquote>
微博上，有网友表示：
<blockquote>
“小爱同学将得到史诗级加强”
<img class=" wscnph" src="https://imageproxy.pbkrs.com/https://wpimg-wscn.awtmt.com/6c374b71-188a-4ec1-9c71-b11f051caba0.png?x-oss-process=image/auto-orient,1/interlace,1/resize,w_1440,h_1440/quality,q_95/format,jpg" width="799" height="145" original-src="https://imageproxy.pbkrs.com/https://wpimg-wscn.awtmt.com/6c374b71-188a-4ec1-9c71-b11f051caba0.png"/>
</blockquote>
尤为值得一提的是，MiMo-7B 的全系列模型均已实现开源，为全球开发者提供了极大的便利。有网友称：
<blockquote>
“关键它还开源 面向全球开源。”
<img class=" wscnph" src="https://imageproxy.pbkrs.com/https://wpimg-wscn.awtmt.com/699b7b86-6043-4307-8ea4-fc2cf1615c79.png?x-oss-process=image/auto-orient,1/interlace,1/resize,w_1440,h_1440/quality,q_95/format,jpg" width="1017" height="399" original-src="https://imageproxy.pbkrs.com/https://wpimg-wscn.awtmt.com/699b7b86-6043-4307-8ea4-fc2cf1615c79.png"/>
</blockquote>
<blockquote>
“出道即巅峰”
<img class=" wscnph" src="https://imageproxy.pbkrs.com/https://wpimg-wscn.awtmt.com/73eafe27-9e45-4c56-b5a6-751b67261e0d.png?x-oss-process=image/auto-orient,1/interlace,1/resize,w_1440,h_1440/quality,q_95/format,jpg" width="1024" height="287" original-src="https://imageproxy.pbkrs.com/https://wpimg-wscn.awtmt.com/73eafe27-9e45-4c56-b5a6-751b67261e0d.png"/>
</blockquote>

小米集团(ADR)

小米集团-W

OpenAI

在相同强化学习 (RL) 训练数据条件下，MiMo-7B 在数学和代码领域展现出的强化学习潜力明显领先于业界广泛使用的其他模型，包括 DeepSeek-R1-Distill-7B 和 Qwen2.5-32B 等知名强化学习起步模型。

- 小米推出开源大模型 MiMo，参数仅 7B，超越 OpenAI 和阿里模型。  
- MiMo 在数学推理和代码竞赛中表现突出，显示出强大推理能力。  
- 小米正建设 GPU 集群，全面投入 AI 领域，吸引顶尖人才。  

小米推出首个推理开源大模型 Mimo！以 7B 参数打败 OpenAI o1-mini 和阿里 QwQ-32B-Preview