小米开源大模型 MiMo-V2-Flash 横空出世！3090 亿参数实现速度成本双突破，赋能全生态观势网

2025 年 12 月 17 日，小米正式官宣开源发布新一代大语言模型 MiMo-V2-Flash。这款采用 MoE 架构设计的模型，以 3090 亿总参数与 150 亿活跃参数的精妙配比，在推理速度、性能表现和成本控制三大核心维度实现关键突破，不仅引发行业对小米 AI 技术落地实力的高度关注，更标志着其 “硬件 + AI” 生态闭环布局迈入新阶段。

Table of Contents

核心性能：对标顶尖开源模型，速度成本双颠覆

权威测试表现亮眼

MiMo-V2-Flash 在多项国际权威测试中展现出媲美头部模型的实力，尤其在编程领域表现突出。其 SWE-Bench Verified 测试解决率高达 73.4%，位列开源模型第一；多语言编程测试（SWE-Bench Multilingual）得分 71.7%，成功超越同类竞品。在 AIME 2025 数学竞赛和 GPQA-Diamond 科学知识测试中，该模型同样跻身开源模型前两名，综合性能与同期顶尖开源模型 DeepSeek-V3.2 不相上下。

架构创新驱动效率革命

模型搭载混合滑动窗口注意力机制与轻量级多 Token 预测（MTP）技术，推理速度达到 150 tokens / 秒，用户实测反馈 “问题秒回”，延迟远低于同类产品。成本控制方面更是实现颠覆性突破，输入仅需$0.1/百万token，输出$0.3 / 百万 token，仅为闭源模型的 1/40，成为当前性价比领先的高性能模型之一。

开源适配覆盖全场景

MiMo-V2-Flash 采用对开发者友好的 MIT 开源协议，基础版权重已上线 Hugging Face 平台。模型支持 256K 超长上下文，可流畅运行于 RTX 3060 等消费级显卡，同时适配手机、汽车、IoT 设备等端侧部署场景，为广泛的应用落地奠定基础。

团队与战略：顶尖人才掌舵，锚定全生态协同

核心团队实力背书

模型由前 DeepSeek 核心研究员罗福莉领衔打造，她主导开发的 MoE 架构优化技术（如 R3 路由重放），为模型轻量化与端侧部署提供了关键支撑。罗福莉的加盟被视为小米冲击 AGI 的重要布局，将持续推动 AI 技术与 “人车家全生态” 的物理世界交互深度融合。

生态协同释放价值

目前，MiMo-V2-Flash 已集成于 Xiaomi MiMO Studio 在线聊天服务，支持联网搜索与深度思考功能。未来，该模型将全面赋能小爱同学、汽车智能座舱决策及智能家居主动服务，与小米自研玄戒 O2 芯片、澎湃 OS 及 9.89 亿台 IoT 设备形成协同，强化 “硬件 + AI” 生态闭环。

用户反馈与行业评价：优势突出，争议并存

实测体验获高度认可

用户实测后普遍称赞其 “颠覆性快” 的响应速度，自然对话逻辑与 DeepSeek 相比更具优势。在旅游攻略制定、健身建议提供、代码生成等实际场景中，模型表现流畅高效，展现出较强的实用价值。

行业争议客观存在

部分用户指出，模型多模态能力暂未公开，长文本处理效果依赖硬件优化。行业整体评价其达到 “国内顶流，国际一流” 水平，但与 GPT-5、Gemini 3.0 Pro 等国际顶尖闭源模型相比仍有差距，未来仍有提升空间。

长期价值：技术普惠 + 生态升级，加速 AGI 落地

降低 AI 应用门槛

MiMo-V2-Flash 的低成本、高效率特性，大幅降低了开发者的使用与部署门槛，将加速 AI 技术在各行业的普及应用，推动技术普惠化进程。

夯实生态竞争壁垒

作为雷军 “五年 2000 亿研发投入” 计划的重要成果，该模型印证了小米在 AI 与芯片领域的技术转化效率。通过打通从语言理解到物理执行的技术路径，小米进一步强化了 “人车家全生态” 的核心竞争力，为 AGI 长远发展筑牢基础。

小米开源大模型 MiMo-V2-Flash 横空出世！3090 亿参数实现速度成本双突破，赋能全生态