小米 MiMo-V2.5：100万 token 上下文，比 Claude 便宜 10 倍

less than 1 minute read

Published: April 29, 2026

小米发布 MiMo-V2.5，310B 参数的稀疏 MoE 模型，激活参数只有 15B，推理成本接近一个小模型，能力是旗舰级别的。原生支持图片和音频输入，上下文最长 100 万 token，权重完整开源在 HuggingFace。

Agent 基准：国产三家和 Claude Opus 咬在一起

Claw-Eval（日常 Agent）：MiMo 65.8 / Kimi 66.7 / Claude Opus 65.4 / Gemini 3.1 Pro 68.5
SWE-Bench Pro（软件工程）：MiMo 56.1 / Claude Opus 57.3 / Kimi 58.6
Coding Agent：MiMo 71.8 / Claude Opus 77.1 / Gemini 3.1 Pro 67.8

MiMo-V2.5 定价大概是 Claude Opus 的十几分之一，开源版可以免费自部署。1M 上下文不再额外收费。做过 Agent 的都知道多轮任务 token 堆得有多快，上下文一贵你就不得不手动压缩中间状态。

下一代已经在训练中，方向是更深的推理、更紧密的工具集成、更丰富的真实世界 grounding。