雷军千万年薪挖的“天才少女”罗福莉主持设计的首秀小米AI,比DeepSeek还强
- AI
- 12小时前
- 12热度
12 月 18 日小米人车家全生态大会上,95 后 “天才少女” 罗福莉一亮相就炸了场 —— 她带队研发的 MiMo-V2-Flash 模型,直接叫板自己曾参与打造的 DeepSeek 系列。这背后藏着雷军的 AI 野心:能让他开出千万年薪的,是罗福莉实打实的履历。这位从四川山村走出来的工程师,北大硕士期间就在 AI 顶会发了 20 多篇论文,后来更是 DeepSeek-V2 的核心开发者,亲手打造过 “中文能力第一梯队” 的大模型。2025 年 11 月她加盟小米时,外界就猜到:小米要在 AI 战场动真格了。
新模型硬刚旧东家:3 大杀招超越 DeepSeek
罗福莉没让人等太久,MiMo-V2-Flash 一出手就拿出了硬核数据:代码能力封神:在多语言软件工程测试中,解决了 71.7% 的问题,不仅碾压所有开源模型,甚至比肩 GPT-5 这样的闭源标杆;速度成本双杀:每秒能生成 150 个字符,比 DeepSeek-V3.2 更快,输入 100 万个字符才花 7 毛钱,价格仅为 Claude 模型的 2.5%;Agent 能力拔尖:在智能体任务测评中冲进全球开源模型 TOP2,能连续完成数百轮工具调用,这正是小米设备互联急需的能力。更妙的是 “以小博大”—— 它的参数只有 309B,是同类模型的 1/3,却靠技术优化实现了性能追平。

不是 “大力出奇迹”:小米 AI 的底层密码
很多人以为大模型拼的是参数规模,但罗福莉戳破了真相:“单纯堆算力的时代过去了”。小米的秘诀在两处:
混合注意力机制:用 5:1 的滑动窗口注意力与全局注意力组合,既保证长文本理解能力,又让推理效率提升 2 倍,就像给模型装了 “精准导航 + 高速引擎”;MOPD 训练黑科技:通过多教师在线蒸馏,用 1/50 的算力就达到了传统模型的效果,解决了 AI 研发 “烧钱如烧纸” 的痛点。这恰好契合小米的需求:既要高性能,又得适配手机、汽车等终端的轻量化部署。
不止于模型:雷军的 “人车家 AI 棋局”
发布 MiMo-V2-Flash,本质是小米生态的 “补脑手术”。目前小米连接着 10 亿台设备,但过去的 “超级小爱” 只是指令执行者,现在有了智能体能力的模型,情况就变了:手机里的 AI 能直接生成代码帮你修图;汽车能预判路况并联动家里的空调提前启动;智能家居会根据你的习惯自主调整模式。为了实现这个目标,小米一年砸 75 亿在 AI 上,还建了万卡 GPU 集群,挖来罗福莉负责基础模型、陈龙攻坚智驾 AI,形成 “双核驱动”。罗福莉在演讲里说的 “打造虚拟宇宙”,其实就是用 AI 打通所有硬件的 “任督二脉”。

思考:小米 AI 还差最后一步
不过现在就喊 “赢了” 还太早。最大的问题是 309B 的参数规模,离手机、手环等端侧设备的部署要求还有距离。好在小米已经明确了路线:一边把模型轻量化,塞进澎湃 OS;一边攻坚物理模型,让 AI 懂现实世界的规律。对行业来说,这倒是个重要启示:硬件企业做 AI,不必跟互联网公司拼通用大模型,像小米这样 “小模型 + 强生态” 的路线,或许更能落地生根。毕竟 AI 的价值,最终要体现在每台设备的体验里。
数据来源和参考文献:
蓝鲸新闻 2025 年 12 月 18 日《罗福莉首秀,雷军的 AI 新战事》
36 氪 2025 年 12 月 17 日《罗福莉首秀前,小米突然发布,代码全球最强》
搜狐网 2025 年 12 月 18 日《小米 AI 新征程:罗福莉领衔,人车家生态借 AI 再进化》
