今天,小米正式发布并开源了 MiMo-V2.5-Pro——他们迄今为止最强大的AI大模型。
这不是一次小版本迭代,而是一次质的飞跃。
核心参数:万亿级MoE架构
先看硬指标:
- 总参数量:1.02万亿(MoE架构),42B激活参数
- 上下文窗口:100万token(约75万字)
- 架构:混合注意力机制(Hybrid Attention)
- 开源:Hugging Face 可下载
1万亿参数什么概念?GPT-4据说也就1.8万亿。小米这次直接把模型拉到了第一梯队。
最震撼的案例:4.3小时完成北大编译器项目
这次发布最让人惊叹的,不是参数有多大,而是实际能力有多强。
小米让MiMo-V2.5-Pro独立完成了一个来自 北京大学《编译原理》课程 的完整项目——用Rust从零实现一个SysY编译器。
这个项目包括:
- 词法分析器(Lexer)
- 语法分析器(Parser)
- 抽象语法树(AST)
- Koopa IR代码生成
- RISC-V汇编后端
- 性能优化
一个北大CS专业学生通常需要 几周时间 才能完成的项目,MiMo-V2.5-Pro只用了 4.3小时,调用工具672次,最终233个测试用例 全部通过,满分。
这个案例的含金量极高——它不是简单的代码生成,而是需要理解编译原理、分阶段调试、持续优化的复杂工程任务。
基准测试:与GPT-5.4、Claude Opus 4.6同台竞技
在多个权威基准测试中,MiMo-V2.5-Pro的表现非常亮眼:
- SWE-Bench Pro(软件工程能力):57.2,与GPT-5.4(57.7)、Claude Opus 4.6(57.3)处于同一水平
- MiMo Coding Bench(编码能力):73.7,超过多数竞品
- Terminal-Bench 2.0(终端操作):68.4
- Humanity’s Last Exam(综合推理):48.0(无工具)/ 58.7(有工具)
特别值得注意的是,在 τ3-bench(工具使用能力)测试中,MiMo-V2.5-Pro拿到了72.9分,与Claude Opus 4.6(72.4)和GPT-5.4(72.9)持平。
这意味着,在Agent场景下,小米的模型已经达到了世界顶级水平。
超长上下文:百万token的真正价值
100万token的上下文窗口不是摆设。
小米在博客中提到,MiMo-V2.5-Pro在内部测试中展现了”前所未有的智能水平”,甚至”迫使研究人员重新思考如何与它协作”。
配合合适的工具框架,它可以:
- 持续执行超过 1000次工具调用 的复杂任务
- 在超长上下文中保持指令遵循能力
- 处理跨数百轮的Agent交互
这对开发者来说意义重大——你可以把一个完整的项目交给它,而不是拆成无数个小任务。
怎么用?
小米已经把MiMo-V2.5-Pro全面部署到:
- API Platform:直接调用
- AI Studio:在线体验
- Hugging Face:开源下载
使用方法很简单,只需将模型标签改为 mimo-v2.5-pro 即可,价格不变。
写在最后
小米这次的动作,标志着国产大模型正式进入”万亿参数时代”。
更重要的是,MiMo-V2.5-Pro不是只在榜单上好看——它在真实工程任务中的表现证明了,AI已经可以独立完成需要数周时间的复杂项目。
对于开发者来说,这意味着一个新时代的到来:AI不再只是”辅助工具”,而是可以独当一面的”工程伙伴”。
开源地址:https://huggingface.co/XiaomiMiMo
官网:https://mimo.xiaomi.com
*作者:攀岩者,技术总监,19年 IT 全栈实战。精通网络、安全、云计算、容器、数据库、超算,持证 PMP、ITIL、CKA、网络工程师、信息安全等级保护、AIX 天工计划。主导过多个千万级政务与智慧城市项目,从售前到交付全流程打通。热衷开源,日拱一卒,每天分享 AI 学习笔记,陪你从零基础到 AI 达人。*
发表回复