小米 MiMo-V2.5:100万 token 上下文,比 Claude 便宜 10 倍

less than 1 minute read

Published:

小米发布 MiMo-V2.5,310B 参数的稀疏 MoE 模型,激活参数只有 15B,推理成本接近一个小模型,能力是旗舰级别的。原生支持图片和音频输入,上下文最长 100 万 token,权重完整开源在 HuggingFace。

Agent 基准:国产三家和 Claude Opus 咬在一起

  • Claw-Eval(日常 Agent):MiMo 65.8 / Kimi 66.7 / Claude Opus 65.4 / Gemini 3.1 Pro 68.5
  • SWE-Bench Pro(软件工程):MiMo 56.1 / Claude Opus 57.3 / Kimi 58.6
  • Coding Agent:MiMo 71.8 / Claude Opus 77.1 / Gemini 3.1 Pro 67.8

多模态

  • 图像理解:MiMo 81.0 / Kimi 80.4 / Claude Opus 77.4
  • 多学科视觉推理 MMMU-Pro:MiMo 88.5 / Gemini 3 Pro 86.4
  • 视频理解:MiMo 83.5 / Gemini 3 Pro 84.2

价格才是重点

MiMo-V2.5 定价大概是 Claude Opus 的十几分之一,开源版可以免费自部署。1M 上下文不再额外收费。做过 Agent 的都知道多轮任务 token 堆得有多快,上下文一贵你就不得不手动压缩中间状态。

下一代已经在训练中,方向是更深的推理、更紧密的工具集成、更丰富的真实世界 grounding。