有消息显示,罗福莉在朋友圈官宣加入小米 Xiaomi MiMo 大模型团队

12 月 17 日小米 “人车家全生态” 大会上,95 后罗福莉的首次公开亮相,比新模型更让人兴奋 —— 这位曾主导 DeepSeek-V2 研发的 “AI 天才”,终于亮出加盟小米后的首份答卷:MiMo-V2-Flash 开源模型。​雷军的耐心没有白费。从 2023 年底传出千万年薪挖角,到 2025 年 11 月罗福莉朋友圈官宣加盟,再到如今模型落地,背后是小米两年多的技术铺垫:2023 年 4 月成立大模型团队,栾剑带队打基础;2024 年 4 月 “Xiaomi MiMo” 公众号官宣,正式打响名号。而罗福莉的加入,相当于给这支团队装上了 “顶尖引擎”,这位北大硕士在 AI 顶会发过 20 多篇论文,亲手打造过中文能力顶尖的大模型,正是小米急需的技术核心。​

309B 参数的 “效率怪物”:MoE 架构藏着什么黑科技

外行看参数,内行看架构。MiMo-V2-Flash 的 309B 总参数看着唬人,但真正厉害的是MoE 混合专家架构,就像医院分科室看病,模型里的 “专家网络” 各管一摊,每次只激活 15B 参数干活。​这种设计直接造出 “性价比王炸”:​代码能力封神:在 SWE-bench 工程测试中拿 73.4 分,比 DeepSeek V3.2 还高,能直接修复真实代码漏洞;​速度成本双杀:每秒生成 150 个字符,比同类模型快 2 倍,输入百万字符才花 0.1 美元,是 Claude 的 1/30;​长文本不 “断片”:支持 256k 上下文,能一口气处理整本书的内容。​罗福莉在会上点出关键:“这不是大模型,是高效智能体的‘沟通语言”,它能联动硬件、处理任务,而非单纯回答问题。​

开源不是 “做慈善”:雷军的生态棋局藏在细节里​

小米突然开源顶级模型,算盘打得很精。要知道,MoE 架构曾是谷歌、Meta 的 “压箱底技术”,因为训练时容易出现 “专家忙闲不均” 的负载均衡难题。而小米不仅攻克难题,还主动开源,核心是要抢生态话语权。​对开发者来说,免费拿到 309B 参数的模型,能快速适配小米设备;对小米而言,这是给 “人车家全生态” 补 “大脑”:​短剧创作降门槛:用 “闪剪 AI” 上传 30 秒视频,MiMo 能复刻数字人、自动剪高光,商家出片效率提 10 倍;​SU7 智能升级:现有小爱音箱能控车,未来 MiMo 可实现 “看一眼后视镜自动调座椅” 的多模态交互;​终端无缝联动:15B 活跃参数刚好适配手机、手环等端侧设备,让 AI 从云端走进硬件。​罗福莉说得直白:“开源是让全人类智慧帮小米迭代 AI,这是通往 AGI 的最快路径”。​

热潮下的冷思考:小米 AI 还差 “最后一公里”​

但现在就喊 “赢了” 还太早,两个难题绕不开:​端侧部署挑战:15B 活跃参数虽小,但要塞进手环、耳机等低算力设备,还需进一步轻量化;​生态协同深度:目前短剧工具、汽车控车还是 “单点发力”,要实现 “看短剧时车自动预热”,需打通数据壁垒。​解法其实藏在技术细节里:用 MoE 的 “动态激活” 特性,让设备按需调用算力;参考 “辅助负载均衡损失” 技术,优化多设备数据分配。小米已经迈出第一步 —— 把模型权重放上网,让开发者帮着找 Bug、做适配。​

给行业的启示:硬件企业的 AI 该这么玩​

小米的打法给同行上了一课:比起跟互联网公司拼通用大模型,硬件企业更该走 “小激活参数 + 强生态绑定” 的路线。就像 MiMo 不是为了跟 GPT-4 比跑分,而是为了让小米设备更聪明。​对普通人来说,这意味着以后做短剧不用买专业设备,开 SU7 能跟车 “聊家常”,AI 终于从实验室走进了生活。

数据来源和参考文献:

小米汽车官网  2025年12月18日《SU7 产品介绍》