2026年3月中文大模型基准测评数据:豆包获71.53分,排名国内第一

PChome | 编辑: 汤雪倩 2026-03-30 14:32:31

PChome 3月30日消息,SuperCLUE发布2026年3月中文大模型基准测评结果,在22款国内外主流模型中,字节跳动旗下豆包(Doubao-Seed-2.0-pro)以71.53分排名国内第一,跻身全球第一梯队;小米MiMo-V2系列两款模型成功上榜。

PChome 3月30日消息,SuperCLUE发布2026年3月中文大模型基准测评结果,在22款国内外主流模型中,字节跳动旗下豆包(Doubao-Seed-2.0-pro)以71.53分排名国内第一,跻身全球第一梯队;小米MiMo-V2系列两款模型成功上榜。

 

本次测评覆盖数学推理、科学推理、代码生成、智能体任务规划等六大核心任务。数据显示,海外闭源模型Claude-Opus-4.6、Gemini-3.1-Pro-Preview、GPT-5.4位列前三。豆包紧随其后,总分仅与GPT-5.4相差0.95分,其中,在智能体任务规划维度方面反超部分海外模型,跻身全球前五。

 

小米MiMo-V2-Pro以60.67分位列闭源模型前列,数学推理得分84.03分,表现亮眼;开源版MiMo-V2-Flash则在代码生成等场景中展现出了技术潜力。从此次数据中可以看出,国产大模型正加速向国际顶尖水平看齐,在中文场景应用市场中具有显著优势。

说明:所有图文均来自网络,版权归原作者所有,如果侵犯您的权益,请联系我们删除。

每日精选

首页 手机 数码相机 笔记本 游戏 DIY硬件 硬件外设 办公中心 数字家电 平板电脑