PChome 3月30日消息,SuperCLUE发布2026年3月中文大模型基准测评结果,在22款国内外主流模型中,字节跳动旗下豆包(Doubao-Seed-2.0-pro)以71.53分排名国内第一,跻身全球第一梯队;小米MiMo-V2系列两款模型成功上榜。
PChome 3月30日消息,SuperCLUE发布2026年3月中文大模型基准测评结果,在22款国内外主流模型中,字节跳动旗下豆包(Doubao-Seed-2.0-pro)以71.53分排名国内第一,跻身全球第一梯队;小米MiMo-V2系列两款模型成功上榜。

本次测评覆盖数学推理、科学推理、代码生成、智能体任务规划等六大核心任务。数据显示,海外闭源模型Claude-Opus-4.6、Gemini-3.1-Pro-Preview、GPT-5.4位列前三。豆包紧随其后,总分仅与GPT-5.4相差0.95分,其中,在智能体任务规划维度方面反超部分海外模型,跻身全球前五。

小米MiMo-V2-Pro以60.67分位列闭源模型前列,数学推理得分84.03分,表现亮眼;开源版MiMo-V2-Flash则在代码生成等场景中展现出了技术潜力。从此次数据中可以看出,国产大模型正加速向国际顶尖水平看齐,在中文场景应用市场中具有显著优势。