
MiniMax(纪要):发力编程、办公、多模态场景
以下为海豚君整理的$MINIMAX-WP(00100.HK) FY25 的财报电话会纪要,财报解读请移步《大模型血亏 360%,MiniMax 照样 “香饽饽”?》
一、财报电话会详细内容
1.1 高管陈述核心信息
1. 语言大模型
a. 模型迭代: 2025 年完成 M2/M2.1 更新,2026 年 2 月发布 M2.5。重点突破了编程、工具调用和办公场景。
b. 关键指标: M2.5 在编程方面刷新 SWE-bench 记录,Token 效率较 M2.1 提升 37%。
c. 开发者生态: 成为 OpenRouter 上首个单日 Token 破 50B 的中国模型。2026 年 2 月日均 Token 消耗量已达 2025 年 12 月的 6 倍以上,其中编程场景消耗量增长超 10 倍。
d. 平台集成: 已部署至 Azure、AWS、Google Vertex AI 等主流平台,并成为 Notion 首个且唯一的开源模型合作伙伴。
2. 多模态生成
a. 视频 (海螺 2.3): 2025 年底累计生成超 6 亿个视频。推出 Fast 模型,批量操作成本降低 50%。
b. 语音 (Speech 2.6): 支持 40 多种语言,累计生成超 2 亿小时音频,主打超低延时交互。
c. 音乐 (Music 2.0/2.5): 实现跨代级提升,支持复杂情感与多种唱法。
3. AI 原生产品与工具
a. 产品升级: 发布 Minimax Expert 2.0,支持 Agent 进入本地工作空间。
b. 用户侧: 截至 2026 年 2 月,专业用户已创建超 5 万个专家 Agent。
c. 全球化: 累计服务超 2.36 亿用户,遍布 200 多个国家。
4. 最新进展
截至 2026 年 2 月,M2 系列单位 Token 推理成本较 2025 年底下降超 50%,海螺视频生成成本下降 30%。管理层强调,模型能力的突破让复杂 Agent 的经济可行性成为现实。2026 年 2 月实现$1.5 亿 ARR,势头强劲。
5. 2026 年战略愿景与业绩指引
a. 三大技术/应用目标:
- 编程: 实现 L4-L5 级智能,由 “工具” 向 “同事” 进化。
- 办公: 复刻去年编程领域的增长曲线,提升智能体渗透率。
- 多模态: 视频创作走向 “直出可交付” 的中长内容及实时流式输出。
b. 战略定位转型:从 “大模型公司” 转型为 “AI 时代的平台型公司”。
a. 管理层提出公司价值 = 提供智能的密度 × Token 的吞吐量。
b. 模型储备: 正在研发 Hailuo 3 系列模型,以应对未来 1-2 个数量级的 Token 增长需求。
1.2 Q&A 问答
Q:面对 Google 和 OpenAI 等巨头的先发优势,MiniMax 作为一家初创公司,成为 AI 平台型公司的核心逻辑和机会在哪里?
A:关于 AI 时代的平台化机会,我们认为当前 AI 市场并非存量博弈,而是一个增量远大于存量的阶段,且这并非一个 “胜者全拿(Winner-takes-all)” 的市场。只要具备创新能力和独特性,初创公司依然有巨大机会。在接下来的 2 到 3 年内,随着模型研发和基建能力的持续提升,编程、办公、互动娱乐等领域将迸发出巨大的创新空间。
从模型层面看,壁垒源于长期的积累与极速的迭代。在过去的 108 天内,我们连续推出了 M2、M2.1、M2.5 三个版本,每一次迭代都直接驱动了用户数和成交比的高速增长。此外,我们从创业初期就坚持跨模态模型研发,这种在多模态融合趋势下的先发优势,将成为我们未来的核心竞争力。
在产品与能力集成层面,MiniMax 是国内首家实现 “技术模型驱动产品” 的公司。我们深信“模型 + 产品” 的双重能力构成了更强的壁垒,因为模型的能力直接定义了产品的上限。这种模型与产品一体化的能力具有极高的复制难度,是公司非常独特的标签。
从生态层面来看,我们已经通过模型特性开始构建小范围生态。例如在 OpenClaw 生态中,MiniMax 的模型凭借高性价比,帮助开发者大幅降低了门槛。同时,我们的 Agent 产品进一步集成了模型能力,降低了用户使用门槛。目前,我们也在积极为开源社区贡献代码,证明了我们推动生态快速发展的能力。
展望未来,形成全球化生态才刚刚开始。下半年我们计划通过 M3 及其后续版本的发布,进一步突破智能边界。我们希望围绕模型建立独特的产品与生态体系。放眼亚洲,MiniMax 可能是目前极少数、甚至唯一的能与大厂并肩,同时在模型、产品、生态三层进行深度布局的初创公司。
Q:关于多模态路径的选择,业界有观点认为 “单点突破再融合” 可能更高效。MiniMax 坚持全模态并行的策略,是否会导致研发负担过重或进度落后?
A:我们始终认为多模态融合是持续提升智能的基本前提。过去半年,行业内已出现多个通过模态融合带来智能质变的案例,例如 Google 的 Nano Banana Pro,通过视觉理解与生成的融合,极大地拓展了图片生成的边界。
MiniMax 的多模态战略分为两个阶段。第一阶段在过去四年已经完成,我们针对语言、视觉、声音、音乐等每个模态都分别做出了具备行业影响力的模型,积累了技术口碑。目前我们正处于第二阶段,即通过底层整合将这些独立走通的模态形成合力,实现新的智能突破。今年上半年即将推出的 M3 和 L3 正是这一阶段的阶段性成果。
这种策略并非负担,而是深厚的壁垒。每个模态从数据积累、算法路径到人才梯队,都需要漫长的建设周期。目前国内仅有三家公司能做到各模态均处于领先水平,而 MiniMax 是其中唯一的初创公司。这种全栈积累让我们在接下来的多模态融合趋势中占据了独特性。
关于市场机会,我们认为视频生成将是 AGI 领域除编程和智能助手之外最大的市场。今年视频生成技术有望推进到中长视频甚至接近实时的水平,这种变革将显著放大市场空间,而我们的多模态融合能力在其中具备独特的机会。
至于研发挑战与财务压力,我们从创业第一天起就认定 AGI 必须包含多模态的输入输出,因此搭建了不同模态可复用的底层能力架构。从财务数据来看,我们的研发费用并未显著高于单一模态的创业公司,且远低于巨头。事实证明,我们的技术判断和前瞻性持续得到验证,我们在多模态并行的前提下,模型表现甚至优于部分只做单一模态的公司。随着时间推移,这种路径的优势会变得更加清晰。
Q:如何看待 L4/L5 级编程智能带来的行业变革(如 AI 替代软件公司),以及 MiniMax 在其中的定位?
A:关于 L4 与 L5 级别的智能,我们认为 L3 是目前行业普遍达到的水平,而 L4 意味着具备创新性,例如单个研究员能基于论文完成实验或解决极具挑战的工程问题。L5 则是组织级智能,能将多人或多个 Agent 有效协同起来,完成像 “开发领先模型” 这种需要算法创新、训练优化和运维配合的综合性任务。
在场景选择上,编程确实是 Agent 能力最早爆发的领域,它不仅服务于专业人士,更在降低编程门槛。但我们认为,办公场景的迭代速度会非常快,且潜在市场远大于编程。大部分白领在日常工作中涉及的数据分析、财务报告撰写、PPT 准备等任务,其受众群体和职业密度远超单纯的编程领域。我们在编程和 Agent 领域已用较少资源取得了独特优势,但这仅仅是个开始。
MiniMax 在这场变革中的优势主要体现在两个方面。首先是极致的迭代速度。从 M2 到 M2.5 的三代模型迭代我们仅花了 108 天,这证明了我们在有限资源下的研发效率。目前公司已经获得了显著更多的资源支持,随着投入增加,我们预期模型进步速度会更快,M3 系列模型将进一步打开增长天花板。
其次是模型的独特性。在 AGI 这样一个巨大的市场中,并非只有 Winner-takes-all,关键在于能否定义自己的技术特色。我们不随波逐流,例如 M2 系列中,我们定义了 M2 的高性价比与超快速度、Hailuo 2 处理复杂任务的能力,以及 Speech 2 的多语言与低延时特性。这种差异化定义帮助我们精准打开了市场。未来,随着资源放大,这种独特性的势能将释放更高价值。我们有信心通过更强的模型、更快的迭代,在编程驱动的智能体及广泛的办公场景中占据更有利的位置,持续提升市场份额。
Q:在巨头环伺、开源模型冲击的复杂格局下,MiniMax 认为竞争的核心在哪一层?哪些仗是必须打赢的?
A:我们努力的目标是成为 AI 时代的平台公司,其核心驱动力在于 “智能密度的持续提升” 以及 “Token 的吞吐能力”。相比行业其他参与者,MiniMax 的战略差异化主要体现在以下两个方面:
首先,在战略定位上,我们坚持 “有所为,有所不为”,聚焦资源于能产生独特价值的领域。
一个典型的例子是,早在 2023 年我们就做出明确判断:坚决不做移动端的通用个人智能助手(类似豆包或 ChatGPT)。我们认为在这些领域无法创造出独属于 MiniMax 的差异化价值,因此我们选择将资源集中在 Agent 和多模态创新上。这种选择有利于我们形成长期的产业化优势,提高决策胜率。此外,我们从第一天起就坚持的全模态布局,在当前 “模态融合” 的关键节点上,让我们占据了更有利的位置。
其次,研发效率是决定胜负的关键,而非单纯的资源消耗。
在 AI 时代,最终胜出的不是靠烧钱,而是看谁的模型进步速度最快,从而率先产生规模化营收。我们在算法优化、实验设计、迭代频次以及决策机制的各个环节,都贯彻了极致的效率。利用创业公司敏捷的组织形式,我们将自上而下与自下而上的决策相结合,并复用不同模态间的技术基础设施。这种研发效率的领先,使我们在资源有限的情况下,模型表现依然能处于核心队列。
长期来看,全球范围内只会留下少数几家 AI 平台型公司。我们认为 MiniMax 已经具备了独特的竞争优势,是极少数具备独立发展潜力、能够留在行业核心队列的公司之一。
Q:2026 年前两个月 M2 系列模型的调用量已达去年 12 月的六倍,增速非常惊人。这可能与近期相关爆款应用的出现以及 M2 模型控制能力的进一步升级有关。请问这种强劲的增长趋势,是一次性爆发的早期红利(未来会出现短期的波峰波谷),还是一个长期可持续趋势的开端?
A:我们认为这是一个长期趋势的开端,而非一次性的红利。不过行业的发展是有规律的,它的增长呈现出阶梯式的特征,而不是简单的线性外推。我们能够不断推出新的模型并更大比例地抓住行业机会,核心在于基于自身对智能迭代的深刻理解,提前储备研发资源,并定义好每一代模型。
关于接下来的增长来源,实际上从 2025 年下半年开始我们就在积极准备。我们认为 2026 年智能涌现会带来几个超级的 PMF(产品市场契合点),未来一年的渗透率和加速度会比市场预期的更快,增长来源也会更加多元化。
第一个超级 PMF 依然在编程领域,它有着非常高的天花板。虽然目前作为辅助工具它的表现已经很好,但我们坚定地认为今年会发生显著的进化,真正走向 “同事级” 的协作,甚至可能走向创新性的发现和复杂的组织配合。无论是从技术演进、市场需求,还是从我们的研发进展来看,这种跨越大概率会在今年发生。
第二个超级 PMF 是各个职业的办公场景。这是一个比编程覆盖范围更广、市场空间更大的领域。办公场景面临的问题比编程更加复杂,因为它涉及众多不同的职业以及更复杂的工具使用,并且很多任务的结果难以被客观验证,这对模型的迭代进度带来了不小的挑战。但我们已经为此做了大量的准备,非常相信今年办公领域的渗透速度可能会和去年的编程领域一样快。
第三个超级 PMF 在于多模态动态生成能力的进展。模型能够直接交互并生成长内容,意味着应用渗透的门槛会被进一步降低。回顾过去两三年,整个大模型领域的竞争其实是一个互有胜负的过程,所有的公司都在面临挑战,没有哪家公司可以保证永远处在 SOTA 的地位。但我们对自己能够持续打赢更多关键战役比较有信心。这背后的核心战略有两点:一是技术能力要持续突破边界;二是借助于技术突破,让我们的产品和业务具备越来越强的生态属性,从而在其中享受到更大的红利。我们有信心跟行业一起成长,让公司的独特性、研发效率、创新能力和全球商业化能力协同提升,最终演变成一个更具扩展性、更加长期的组织竞争力。
Q:管理层提到公司内部的 “AI 实习生” 已经覆盖了 90% 的员工,实际上是将公司本身当成了一个前沿的实验场。这种做法为我们带来了哪些外部看不到的认知?这些认知又是如何反哺我们的产品和技术的?
A:我们不仅希望未来成为一家平台型的 AI 公司,更希望在当下的研发过程中,先把自己打造成一个 “AI 原生” 的组织,这是我们组织层面非常核心的追求目标。这里面我想强调两点带来的改变:
第一点是组织进步的速度。作为一家资源相对有限的创业公司,我们必须将组织效率提升到极致才能创造更大的可能性。随着内部越来越多的同事将 AI 引入日常工作,我们看到了一个非常明显的趋势:一开始是人在教 Agent 怎么干活,现在越来越多是人在观察 Agent 怎么干活,甚至有时 Agent 会给人带来惊喜。这显著缩短了我们的组织链路,让业务的每个环节都享受到了智能红利。从模型迭代、产品创新到服务用户,我们的迭代闭环一直在加快。同时,我们的员工也有机会把时间节省下来,投入到价值更大的事情上,这进一步加速了整个组织的思考与创新能力。
第二点是内部实验场对模型研发的反哺作用。它让我们更清晰地看清了前沿智能的目标定义。当 Agent 在公司内部大量运行起来时,我们能敏锐地观测到,即使是当下最好的模型,在很多环节依然做不好;而恰恰是这些做不好的地方,往往具备极高的经济价值和使用价值。这些一线的痛点会直接转化为我们下一代模型和 Agent 的研发方向,帮助我们更快速、精准地定义研发目标。当我们的模型越来越接近世界一流水平时,这种内部验证的价值会成倍放大。在过去几个月里,我们的模型迭代速度、收入增速、服务用户能力以及 Token 吞吐能力,都在持续进步,这同样得益于我们能更快地定义模型目标,让 AI 在内部充分发挥价值。
总而言之,这种基于 Agent 构建的 AI 原生组织模式,目前在公司内部已经跑通并形成了一个正向飞轮,我们认为这将会是公司未来持续发展的一项核心竞争力。
<此处结束>
本文的风险披露与声明:海豚研究免责声明及一般披露
