在数学推理(AIME24-25)和代码竞赛(LiveCodeBench v5)公开测评集中,MiMo仅用7B的参数规模,超越了OpenAI的闭源推理模型o1-mini,以及阿里Qwen更大规模的开源推理模型QwQ-32B-Preview。
2025年4月30日,小米大模型团队宣布,正式开源首个“为推理而生”的大模型Xiaomi MiMo,从预训练到后训练全面提升推理能力。

据了解,MiMo来自新成立的“小米大模型Core团队”。在数学推理(AIME24-25)和代码竞赛(LiveCodeBench v5)公开测评集中,MiMo仅用7B的参数规模,超越了OpenAI的闭源推理模型o1-mini,以及阿里Qwen更大规模的开源推理模型QwQ-32B-Preview。

官方表示,MiMo推理能力的提升,得益于预训练和后训练阶段中数据和算法等多层面的创新,包括挖掘富推理语料、进行三阶段训练,以及采用Test Difficulty Driven Reward算法和Seamless Rollout框架等。
目前,MiMo-7B已开源4个模型至HuggingFace。