小米认领网传神秘顶尖模型:罗福莉承诺 MiMo-V2 系列将开源,内部强推智能体“不用就辞职”

业界
2026
03/19
14:05
IT之家
分享
评论

3 月 19 日消息,代号为“Hunter Alpha”的神秘模型本月(3 月)在全球最大 API 聚合平台 OpenRouter 引发热议,一度登上大模型调用榜第一,不少网友猜测是“DeepSeek V4”早期版本。

图片

今天(19 日)凌晨,小米正式认领“Hunter Alpha”,宣布推出三款大模型 —— MiMo-V2-Pro & Omni & TTS,可限时免费体验一周。

随后,小米 MiMo 大模型负责人罗福莉发布长文,表示这是小米首款真正为智能体时代打造的全栈产品系列。

我称之为一次悄无声息的伏击 —— 并非因为我们事先策划,而是因为从聊天模式到智能代理模式的转变发生得太快,连我们自己都难以置信。在这两者之间,经历了一个既激动人心又痛苦不堪,同时又引人入胜的过程。

1T 基础模型几个月前就开始训练了。最初的目标是提高长上下文推理的效率。混合注意力机制带来了真正的创新,却又不至于过度扩张 —— 事实证明,它正是智能体时代最合适的基石。1M 上下文窗口。MTP 推理实现超低延迟和成本。这些架构决策并非一时兴起,而是我们在需要之前就构建的结构性优势。

真正改变一切的是我第一次体验到复杂的智能体框架 —— 我称之为“精心编排的语境”。第一天我就震惊了。我试图说服团队使用它,但没有成功。于是我下达了一条强硬指令:MiMo 团队中,明天对话次数少于 100 次的成员可以辞职。这招奏效了。一旦团队的想象力被智能体系统的功能所激发,这种想象力便直接转化为研究速度。

人们问我们为什么发展如此迅速。我在构建 DeepSeek R1 时亲身经历了这一点。我的真实总结是:

—— 骨干网和基础设施研究周期很长。你需要一年的战略决心才能看到回报。

—— 训练后敏捷性是一种不同的能力:产品直觉驱动评估,迭代周期缩短,范式转变及早发生。

—— 以及不变的:好奇心、敏锐的技术直觉、果断的执行力、全身心的投入。

—— 还有一点很容易被低估:对你所创造的世界的真挚热爱。

罗福莉还承诺,新的 MiMo-V2 系列模型会开源 —— 当模型足够稳定,值得开源的时候。

【来源:IT之家】

THE END
广告、内容合作请点击这里 寻求合作
小米
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表 的观点和立场。

相关热点

3月19日消息,今日,小米正式发布面向Agent时代的旗舰基座模型Xiaomi MiMo-V2-Pro。
业界
3月19日消息,今日,小米发布Xiaomi MiMo-V2-TTS,这是小米自研语音合成大模型,不仅能说、能演,还会唱。
业界
3月19日,小米发布面向Agent时代的全模态基座模型Xiaomi MiMo-V2-Omni。
业界
3 月 17 日消息,据智能纪元 AGI 昨日(3 月 16 日)报道,前 DeepSeek 研究员、小米 MiMo 大模型负责人罗福莉发表论文,与北京大学联合研发出统一的资源管理系统 ARL-Tangram。
业界
3月13日,据财联社报道,针对与中国车企合作传闻,Stellantis集团称,作为Stellantis集团正常业务运营的一部分,集团与遍布全球的行业优秀企业就各种主题进行讨论,并始终以“向客户提供最佳的出行方式”...
业界

相关推荐

1
3
Baidu
map