小米MiMo-V2.5-Pro开源：1万亿参数大模型，4.3小时搞定北大CS课程项目

!小米MiMo-V2.5-Pro

今天，小米正式发布并开源了 MiMo-V2.5-Pro——他们迄今为止最强大的AI大模型。

这不是一次小版本迭代，而是一次质的飞跃。

核心参数：万亿级MoE架构

先看硬指标：

总参数量：1.02万亿（MoE架构），42B激活参数
上下文窗口：100万token（约75万字）
架构：混合注意力机制（Hybrid Attention）
开源：Hugging Face 可下载

1万亿参数什么概念？GPT-4据说也就1.8万亿。小米这次直接把模型拉到了第一梯队。

最震撼的案例：4.3小时完成北大编译器项目

这次发布最让人惊叹的，不是参数有多大，而是实际能力有多强。

小米让MiMo-V2.5-Pro独立完成了一个来自 北京大学《编译原理》课程 的完整项目——用Rust从零实现一个SysY编译器。

这个项目包括：

词法分析器（Lexer）
语法分析器（Parser）
抽象语法树（AST）
Koopa IR代码生成
RISC-V汇编后端
性能优化

一个北大CS专业学生通常需要 几周时间 才能完成的项目，MiMo-V2.5-Pro只用了 4.3小时，调用工具672次，最终233个测试用例 全部通过，满分。

这个案例的含金量极高——它不是简单的代码生成，而是需要理解编译原理、分阶段调试、持续优化的复杂工程任务。

基准测试：与GPT-5.4、Claude Opus 4.6同台竞技

在多个权威基准测试中，MiMo-V2.5-Pro的表现非常亮眼：

SWE-Bench Pro（软件工程能力）：57.2，与GPT-5.4（57.7）、Claude Opus 4.6（57.3）处于同一水平
MiMo Coding Bench（编码能力）：73.7，超过多数竞品
Terminal-Bench 2.0（终端操作）：68.4
Humanity’s Last Exam（综合推理）：48.0（无工具）/ 58.7（有工具）

特别值得注意的是，在 τ3-bench（工具使用能力）测试中，MiMo-V2.5-Pro拿到了72.9分，与Claude Opus 4.6（72.4）和GPT-5.4（72.9）持平。

这意味着，在Agent场景下，小米的模型已经达到了世界顶级水平。

超长上下文：百万token的真正价值

100万token的上下文窗口不是摆设。

小米在博客中提到，MiMo-V2.5-Pro在内部测试中展现了”前所未有的智能水平”，甚至”迫使研究人员重新思考如何与它协作”。

配合合适的工具框架，它可以：

持续执行超过 1000次工具调用 的复杂任务
在超长上下文中保持指令遵循能力
处理跨数百轮的Agent交互

这对开发者来说意义重大——你可以把一个完整的项目交给它，而不是拆成无数个小任务。

怎么用？

小米已经把MiMo-V2.5-Pro全面部署到：

API Platform：直接调用
AI Studio：在线体验
Hugging Face：开源下载

使用方法很简单，只需将模型标签改为 mimo-v2.5-pro 即可，价格不变。

写在最后

小米这次的动作，标志着国产大模型正式进入”万亿参数时代”。

更重要的是，MiMo-V2.5-Pro不是只在榜单上好看——它在真实工程任务中的表现证明了，AI已经可以独立完成需要数周时间的复杂项目。

对于开发者来说，这意味着一个新时代的到来：AI不再只是”辅助工具”，而是可以独当一面的”工程伙伴”。

开源地址：https://huggingface.co/XiaomiMiMo

官网：https://mimo.xiaomi.com

*作者：攀岩者，技术总监，19年 IT 全栈实战。精通网络、安全、云计算、容器、数据库、超算，持证 PMP、ITIL、CKA、网络工程师、信息安全等级保护、AIX 天工计划。主导过多个千万级政务与智慧城市项目，从售前到交付全流程打通。热衷开源，日拱一卒，每天分享 AI 学习笔记，陪你从零基础到 AI 达人。*

小米MiMo-V2.5-Pro开源：1万亿参数大模型，4.3小时搞定北大CS课程项目

核心参数：万亿级MoE架构

最震撼的案例：4.3小时完成北大编译器项目

基准测试：与GPT-5.4、Claude Opus 4.6同台竞技

超长上下文：百万token的真正价值

怎么用？

写在最后

评论

发表回复 取消回复

更多文章

攀岩运动简介

Day70——晚课 AI学习者指南：持续成长

Day70——午课 黄仁勋首推力挺开源AI

Day70——早课 AI学习者指南：持续成长

Day69——晚课 AI创业与商业

发表回复取消回复

Day70——午课黄仁勋首推力挺开源AI