2025 年 12 月 17 日,小米正式官宣开源发布新一代大语言模型 MiMo-V2-Flash。这款采用 MoE 架构设计的模型,以 3090 亿总参数与 150 亿活跃参数的精妙配比,在推理速度、性能表现和成本控制三大核心维度实现关键突破,不仅引发行业对小米 AI 技术落地实力的高度关注,更标志着其 “硬件 + AI” 生态闭环布局迈入新阶段。
核心性能:对标顶尖开源模型,速度成本双颠覆
权威测试表现亮眼
MiMo-V2-Flash 在多项国际权威测试中展现出媲美头部模型的实力,尤其在编程领域表现突出。其 SWE-Bench Verified 测试解决率高达 73.4%,位列开源模型第一;多语言编程测试(SWE-Bench Multilingual)得分 71.7%,成功超越同类竞品。在 AIME 2025 数学竞赛和 GPQA-Diamond 科学知识测试中,该模型同样跻身开源模型前两名,综合性能与同期顶尖开源模型 DeepSeek-V3.2 不相上下。
架构创新驱动效率革命
模型搭载混合滑动窗口注意力机制与轻量级多 Token 预测(MTP)技术,推理速度达到 150 tokens / 秒,用户实测反馈 “问题秒回”,延迟远低于同类产品。成本控制方面更是实现颠覆性突破,输入仅需$0.1/百万token,输出$0.3 / 百万 token,仅为闭源模型的 1/40,成为当前性价比领先的高性能模型之一。
开源适配覆盖全场景
MiMo-V2-Flash 采用对开发者友好的 MIT 开源协议,基础版权重已上线 Hugging Face 平台。模型支持 256K 超长上下文,可流畅运行于 RTX 3060 等消费级显卡,同时适配手机、汽车、IoT 设备等端侧部署场景,为广泛的应用落地奠定基础。
团队与战略:顶尖人才掌舵,锚定全生态协同
核心团队实力背书
模型由前 DeepSeek 核心研究员罗福莉领衔打造,她主导开发的 MoE 架构优化技术(如 R3 路由重放),为模型轻量化与端侧部署提供了关键支撑。罗福莉的加盟被视为小米冲击 AGI 的重要布局,将持续推动 AI 技术与 “人车家全生态” 的物理世界交互深度融合。
生态协同释放价值
目前,MiMo-V2-Flash 已集成于 Xiaomi MiMO Studio 在线聊天服务,支持联网搜索与深度思考功能。未来,该模型将全面赋能小爱同学、汽车智能座舱决策及智能家居主动服务,与小米自研玄戒 O2 芯片、澎湃 OS 及 9.89 亿台 IoT 设备形成协同,强化 “硬件 + AI” 生态闭环。
用户反馈与行业评价:优势突出,争议并存
实测体验获高度认可
用户实测后普遍称赞其 “颠覆性快” 的响应速度,自然对话逻辑与 DeepSeek 相比更具优势。在旅游攻略制定、健身建议提供、代码生成等实际场景中,模型表现流畅高效,展现出较强的实用价值。
行业争议客观存在
部分用户指出,模型多模态能力暂未公开,长文本处理效果依赖硬件优化。行业整体评价其达到 “国内顶流,国际一流” 水平,但与 GPT-5、Gemini 3.0 Pro 等国际顶尖闭源模型相比仍有差距,未来仍有提升空间。
长期价值:技术普惠 + 生态升级,加速 AGI 落地
降低 AI 应用门槛
MiMo-V2-Flash 的低成本、高效率特性,大幅降低了开发者的使用与部署门槛,将加速 AI 技术在各行业的普及应用,推动技术普惠化进程。
夯实生态竞争壁垒
作为雷军 “五年 2000 亿研发投入” 计划的重要成果,该模型印证了小米在 AI 与芯片领域的技术转化效率。通过打通从语言理解到物理执行的技术路径,小米进一步强化了 “人车家全生态” 的核心竞争力,为 AGI 长远发展筑牢基础。
