MiniMax（纪要）：发力编程、办公、多模态场景

以下为海豚君整理的$MINIMAX-W(00100.HK) FY25 的财报电话会纪要，财报解读请移步《大模型血亏 360%，MiniMax 照样 “香饽饽”？》

一、财报电话会详细内容

1.1 高管陈述核心信息

1. 语言大模型

a. 模型迭代： 2025 年完成 M2/M2.1 更新，2026 年 2 月发布 M2.5。重点突破了编程、工具调用和办公场景。

b. 关键指标： M2.5 在编程方面刷新 SWE-bench 记录，Token 效率较 M2.1 提升 37%。

c. 开发者生态：成为 OpenRouter 上首个单日 Token 破 50B 的中国模型。2026 年 2 月日均 Token 消耗量已达 2025 年 12 月的 6 倍以上，其中编程场景消耗量增长超 10 倍。

d. 平台集成：已部署至 Azure、AWS、Google Vertex AI 等主流平台，并成为 Notion 首个且唯一的开源模型合作伙伴。

2. 多模态生成

a. 视频 (海螺 2.3)： 2025 年底累计生成超 6 亿个视频。推出 Fast 模型，批量操作成本降低 50%。

b. 语音 (Speech 2.6)：支持 40 多种语言，累计生成超 2 亿小时音频，主打超低延时交互。

c. 音乐 (Music 2.0/2.5)：实现跨代级提升，支持复杂情感与多种唱法。

3. AI 原生产品与工具

a. 产品升级：发布 Minimax Expert 2.0，支持 Agent 进入本地工作空间。

b. 用户侧：截至 2026 年 2 月，专业用户已创建超 5 万个专家 Agent。

c. 全球化：累计服务超 2.36 亿用户，遍布 200 多个国家。

4. 最新进展

截至 2026 年 2 月，M2 系列单位 Token 推理成本较 2025 年底下降超 50%，海螺视频生成成本下降 30%。管理层强调，模型能力的突破让复杂 Agent 的经济可行性成为现实。2026 年 2 月实现$1.5 亿 ARR，势头强劲。

5. 2026 年战略愿景与业绩指引

a. 三大技术/应用目标：

- 编程：实现 L4-L5 级智能，由 “工具” 向 “同事” 进化。

- 办公：复刻去年编程领域的增长曲线，提升智能体渗透率。

- 多模态：视频创作走向 “直出可交付” 的中长内容及实时流式输出。

b. 战略定位转型：从 “大模型公司” 转型为 “AI 时代的平台型公司”。

a. 管理层提出公司价值 = 提供智能的密度 × Token 的吞吐量。

b. 模型储备：正在研发 Hailuo 3 系列模型，以应对未来 1-2 个数量级的 Token 增长需求。

1.2 Q&A 问答

Q：面对 Google 和 OpenAI 等巨头的先发优势，MiniMax 作为一家初创公司，成为 AI 平台型公司的核心逻辑和机会在哪里？

A：关于 AI 时代的平台化机会，我们认为当前 AI 市场并非存量博弈，而是一个增量远大于存量的阶段，且这并非一个 “胜者全拿（Winner-takes-all）” 的市场。只要具备创新能力和独特性，初创公司依然有巨大机会。在接下来的 2 到 3 年内，随着模型研发和基建能力的持续提升，编程、办公、互动娱乐等领域将迸发出巨大的创新空间。

从模型层面看，壁垒源于长期的积累与极速的迭代。在过去的 108 天内，我们连续推出了 M2、M2.1、M2.5 三个版本，每一次迭代都直接驱动了用户数和成交比的高速增长。此外，我们从创业初期就坚持跨模态模型研发，这种在多模态融合趋势下的先发优势，将成为我们未来的核心竞争力。

在产品与能力集成层面，MiniMax 是国内首家实现 “技术模型驱动产品” 的公司。我们深信“模型 + 产品” 的双重能力构成了更强的壁垒，因为模型的能力直接定义了产品的上限。这种模型与产品一体化的能力具有极高的复制难度，是公司非常独特的标签。

从生态层面来看，我们已经通过模型特性开始构建小范围生态。例如在 OpenClaw 生态中，MiniMax 的模型凭借高性价比，帮助开发者大幅降低了门槛。同时，我们的 Agent 产品进一步集成了模型能力，降低了用户使用门槛。目前，我们也在积极为开源社区贡献代码，证明了我们推动生态快速发展的能力。

展望未来，形成全球化生态才刚刚开始。下半年我们计划通过 M3 及其后续版本的发布，进一步突破智能边界。我们希望围绕模型建立独特的产品与生态体系。放眼亚洲，MiniMax 可能是目前极少数、甚至唯一的能与大厂并肩，同时在模型、产品、生态三层进行深度布局的初创公司。

Q：关于多模态路径的选择，业界有观点认为 “单点突破再融合” 可能更高效。MiniMax 坚持全模态并行的策略，是否会导致研发负担过重或进度落后？

A：我们始终认为多模态融合是持续提升智能的基本前提。过去半年，行业内已出现多个通过模态融合带来智能质变的案例，例如 Google 的 Nano Banana Pro，通过视觉理解与生成的融合，极大地拓展了图片生成的边界。

MiniMax 的多模态战略分为两个阶段。第一阶段在过去四年已经完成，我们针对语言、视觉、声音、音乐等每个模态都分别做出了具备行业影响力的模型，积累了技术口碑。目前我们正处于第二阶段，即通过底层整合将这些独立走通的模态形成合力，实现新的智能突破。今年上半年即将推出的 M3 和 L3 正是这一阶段的阶段性成果。

这种策略并非负担，而是深厚的壁垒。每个模态从数据积累、算法路径到人才梯队，都需要漫长的建设周期。目前国内仅有三家公司能做到各模态均处于领先水平，而 MiniMax 是其中唯一的初创公司。这种全栈积累让我们在接下来的多模态融合趋势中占据了独特性。

关于市场机会，我们认为视频生成将是 AGI 领域除编程和智能助手之外最大的市场。今年视频生成技术有望推进到中长视频甚至接近实时的水平，这种变革将显著放大市场空间，而我们的多模态融合能力在其中具备独特的机会。

至于研发挑战与财务压力，我们从创业第一天起就认定 AGI 必须包含多模态的输入输出，因此搭建了不同模态可复用的底层能力架构。从财务数据来看，我们的研发费用并未显著高于单一模态的创业公司，且远低于巨头。事实证明，我们的技术判断和前瞻性持续得到验证，我们在多模态并行的前提下，模型表现甚至优于部分只做单一模态的公司。随着时间推移，这种路径的优势会变得更加清晰。

Q：如何看待 L4/L5 级编程智能带来的行业变革（如 AI 替代软件公司），以及 MiniMax 在其中的定位？

A：关于 L4 与 L5 级别的智能，我们认为 L3 是目前行业普遍达到的水平，而 L4 意味着具备创新性，例如单个研究员能基于论文完成实验或解决极具挑战的工程问题。L5 则是组织级智能，能将多人或多个 Agent 有效协同起来，完成像 “开发领先模型” 这种需要算法创新、训练优化和运维配合的综合性任务。

在场景选择上，编程确实是 Agent 能力最早爆发的领域，它不仅服务于专业人士，更在降低编程门槛。但我们认为，办公场景的迭代速度会非常快，且潜在市场远大于编程。大部分白领在日常工作中涉及的数据分析、财务报告撰写、PPT 准备等任务，其受众群体和职业密度远超单纯的编程领域。我们在编程和 Agent 领域已用较少资源取得了独特优势，但这仅仅是个开始。

MiniMax 在这场变革中的优势主要体现在两个方面。首先是极致的迭代速度。从 M2 到 M2.5 的三代模型迭代我们仅花了 108 天，这证明了我们在有限资源下的研发效率。目前公司已经获得了显著更多的资源支持，随着投入增加，我们预期模型进步速度会更快，M3 系列模型将进一步打开增长天花板。

其次是模型的独特性。在 AGI 这样一个巨大的市场中，并非只有 Winner-takes-all，关键在于能否定义自己的技术特色。我们不随波逐流，例如 M2 系列中，我们定义了 M2 的高性价比与超快速度、Hailuo 2 处理复杂任务的能力，以及 Speech 2 的多语言与低延时特性。这种差异化定义帮助我们精准打开了市场。未来，随着资源放大，这种独特性的势能将释放更高价值。我们有信心通过更强的模型、更快的迭代，在编程驱动的智能体及广泛的办公场景中占据更有利的位置，持续提升市场份额。

Q：在巨头环伺、开源模型冲击的复杂格局下，MiniMax 认为竞争的核心在哪一层？哪些仗是必须打赢的？

A：我们努力的目标是成为 AI 时代的平台公司，其核心驱动力在于 “智能密度的持续提升” 以及 “Token 的吞吐能力”。相比行业其他参与者，MiniMax 的战略差异化主要体现在以下两个方面：

首先，在战略定位上，我们坚持 “有所为，有所不为”，聚焦资源于能产生独特价值的领域。

一个典型的例子是，早在 2023 年我们就做出明确判断：坚决不做移动端的通用个人智能助手（类似豆包或 ChatGPT）。我们认为在这些领域无法创造出独属于 MiniMax 的差异化价值，因此我们选择将资源集中在 Agent 和多模态创新上。这种选择有利于我们形成长期的产业化优势，提高决策胜率。此外，我们从第一天起就坚持的全模态布局，在当前 “模态融合” 的关键节点上，让我们占据了更有利的位置。

其次，研发效率是决定胜负的关键，而非单纯的资源消耗。

在 AI 时代，最终胜出的不是靠烧钱，而是看谁的模型进步速度最快，从而率先产生规模化营收。我们在算法优化、实验设计、迭代频次以及决策机制的各个环节，都贯彻了极致的效率。利用创业公司敏捷的组织形式，我们将自上而下与自下而上的决策相结合，并复用不同模态间的技术基础设施。这种研发效率的领先，使我们在资源有限的情况下，模型表现依然能处于核心队列。

长期来看，全球范围内只会留下少数几家 AI 平台型公司。我们认为 MiniMax 已经具备了独特的竞争优势，是极少数具备独立发展潜力、能够留在行业核心队列的公司之一。

Q：2026 年前两个月 M2 系列模型的调用量已达去年 12 月的六倍，增速非常惊人。这可能与近期相关爆款应用的出现以及 M2 模型控制能力的进一步升级有关。请问这种强劲的增长趋势，是一次性爆发的早期红利（未来会出现短期的波峰波谷），还是一个长期可持续趋势的开端？

A：我们认为这是一个长期趋势的开端，而非一次性的红利。不过行业的发展是有规律的，它的增长呈现出阶梯式的特征，而不是简单的线性外推。我们能够不断推出新的模型并更大比例地抓住行业机会，核心在于基于自身对智能迭代的深刻理解，提前储备研发资源，并定义好每一代模型。

关于接下来的增长来源，实际上从 2025 年下半年开始我们就在积极准备。我们认为 2026 年智能涌现会带来几个超级的 PMF（产品市场契合点），未来一年的渗透率和加速度会比市场预期的更快，增长来源也会更加多元化。

第一个超级 PMF 依然在编程领域，它有着非常高的天花板。虽然目前作为辅助工具它的表现已经很好，但我们坚定地认为今年会发生显著的进化，真正走向 “同事级” 的协作，甚至可能走向创新性的发现和复杂的组织配合。无论是从技术演进、市场需求，还是从我们的研发进展来看，这种跨越大概率会在今年发生。

第二个超级 PMF 是各个职业的办公场景。这是一个比编程覆盖范围更广、市场空间更大的领域。办公场景面临的问题比编程更加复杂，因为它涉及众多不同的职业以及更复杂的工具使用，并且很多任务的结果难以被客观验证，这对模型的迭代进度带来了不小的挑战。但我们已经为此做了大量的准备，非常相信今年办公领域的渗透速度可能会和去年的编程领域一样快。

第三个超级 PMF 在于多模态动态生成能力的进展。模型能够直接交互并生成长内容，意味着应用渗透的门槛会被进一步降低。回顾过去两三年，整个大模型领域的竞争其实是一个互有胜负的过程，所有的公司都在面临挑战，没有哪家公司可以保证永远处在 SOTA 的地位。但我们对自己能够持续打赢更多关键战役比较有信心。这背后的核心战略有两点：一是技术能力要持续突破边界；二是借助于技术突破，让我们的产品和业务具备越来越强的生态属性，从而在其中享受到更大的红利。我们有信心跟行业一起成长，让公司的独特性、研发效率、创新能力和全球商业化能力协同提升，最终演变成一个更具扩展性、更加长期的组织竞争力。

Q：管理层提到公司内部的 “AI 实习生” 已经覆盖了 90% 的员工，实际上是将公司本身当成了一个前沿的实验场。这种做法为我们带来了哪些外部看不到的认知？这些认知又是如何反哺我们的产品和技术的？

A：我们不仅希望未来成为一家平台型的 AI 公司，更希望在当下的研发过程中，先把自己打造成一个 “AI 原生” 的组织，这是我们组织层面非常核心的追求目标。这里面我想强调两点带来的改变：

第一点是组织进步的速度。作为一家资源相对有限的创业公司，我们必须将组织效率提升到极致才能创造更大的可能性。随着内部越来越多的同事将 AI 引入日常工作，我们看到了一个非常明显的趋势：一开始是人在教 Agent 怎么干活，现在越来越多是人在观察 Agent 怎么干活，甚至有时 Agent 会给人带来惊喜。这显著缩短了我们的组织链路，让业务的每个环节都享受到了智能红利。从模型迭代、产品创新到服务用户，我们的迭代闭环一直在加快。同时，我们的员工也有机会把时间节省下来，投入到价值更大的事情上，这进一步加速了整个组织的思考与创新能力。

第二点是内部实验场对模型研发的反哺作用。它让我们更清晰地看清了前沿智能的目标定义。当 Agent 在公司内部大量运行起来时，我们能敏锐地观测到，即使是当下最好的模型，在很多环节依然做不好；而恰恰是这些做不好的地方，往往具备极高的经济价值和使用价值。这些一线的痛点会直接转化为我们下一代模型和 Agent 的研发方向，帮助我们更快速、精准地定义研发目标。当我们的模型越来越接近世界一流水平时，这种内部验证的价值会成倍放大。在过去几个月里，我们的模型迭代速度、收入增速、服务用户能力以及 Token 吞吐能力，都在持续进步，这同样得益于我们能更快地定义模型目标，让 AI 在内部充分发挥价值。

总而言之，这种基于 Agent 构建的 AI 原生组织模式，目前在公司内部已经跑通并形成了一个正向飞轮，我们认为这将会是公司未来持续发展的一项核心竞争力。

<此处结束>

本文的风险披露与声明：海豚研究免责声明及一般披露

Dolphin Research, a professional investment research team in the secondary market, offers insights into global core assets and opportunities with in-depth analysis and distinctive perspectives.

Download the Longbridge App to unlock an extensive range of content from Dolphin Research:

Covering interpretations of financial reports, summary analyses, in-depth data analyses, macro strategies, portfolio allocation insights, and more.