小米认领网传神秘顶尖模型：罗福莉承诺 MiMo-V2 系列将开源，内部强推智能体“不用就辞职”

业界

2026

03/19

14:05

IT之家

3 月 19 日消息，代号为“Hunter Alpha”的神秘模型本月（3 月）在全球最大 API 聚合平台 OpenRouter 引发热议，一度登上大模型调用榜第一，不少网友猜测是“DeepSeek V4”早期版本。

今天（19 日）凌晨，小米正式认领“Hunter Alpha”，宣布推出三款大模型 —— MiMo-V2-Pro & Omni & TTS，可限时免费体验一周。

随后，小米 MiMo 大模型负责人罗福莉发布长文，表示这是小米首款真正为智能体时代打造的全栈产品系列。

我称之为一次悄无声息的伏击 —— 并非因为我们事先策划，而是因为从聊天模式到智能代理模式的转变发生得太快，连我们自己都难以置信。在这两者之间，经历了一个既激动人心又痛苦不堪，同时又引人入胜的过程。

1T 基础模型几个月前就开始训练了。最初的目标是提高长上下文推理的效率。混合注意力机制带来了真正的创新，却又不至于过度扩张 —— 事实证明，它正是智能体时代最合适的基石。1M 上下文窗口。MTP 推理实现超低延迟和成本。这些架构决策并非一时兴起，而是我们在需要之前就构建的结构性优势。

真正改变一切的是我第一次体验到复杂的智能体框架 —— 我称之为“精心编排的语境”。第一天我就震惊了。我试图说服团队使用它，但没有成功。于是我下达了一条强硬指令：MiMo 团队中，明天对话次数少于 100 次的成员可以辞职。这招奏效了。一旦团队的想象力被智能体系统的功能所激发，这种想象力便直接转化为研究速度。

人们问我们为什么发展如此迅速。我在构建 DeepSeek R1 时亲身经历了这一点。我的真实总结是：

—— 骨干网和基础设施研究周期很长。你需要一年的战略决心才能看到回报。

—— 训练后敏捷性是一种不同的能力：产品直觉驱动评估，迭代周期缩短，范式转变及早发生。

—— 以及不变的：好奇心、敏锐的技术直觉、果断的执行力、全身心的投入。

—— 还有一点很容易被低估：对你所创造的世界的真挚热爱。

罗福莉还承诺，新的 MiMo-V2 系列模型会开源 —— 当模型足够稳定，值得开源的时候。