大模型基准测试发布讯飞星火认知大模型国内第一

PChome | 编辑: 吕昊 2023-05-10 15:20:58原创

中文通用大模型综合性评测基准SuperCLUE正式发布。该模型可通过多个层面，考研市面上主流的中文GPT大模型的能力。

日前，中文通用大模型综合性评测基准SuperCLUE正式发布。该模型可通过多个层面，考研市面上主流的中文GPT大模型的能力。

据了解，基础能力包括了常见的有代表性的模型能力，如语义理解、对话、逻辑推理、角色模拟、代码、生成与创作等10项能力；专业能力包括了中学、大学与专业考试，涵盖了从数学、物理、地理到社会科学等50多项能力；中文特性能力针对有中文特点的任务，包括了中文成语、诗歌、文学、字形等10项多种能力。

该机构利用SuperCLUE测试基准，对市面上主流的支持中文的通用大模型进行了评测与排名。从排名中我们可以看出，GPT-4一骑绝尘，已经非常接近人类的能力。国产大模型中科大讯飞研发的星火认知大模型总排名第三，国内排名第一。

以下为该机构公布的各个子项目的具体得分。排行榜会定期更新，并于以下网站进行公示。

总榜单

基础能力榜单

中文特性榜单

每日精选

华为三星大阔折核心优缺点路线差异一目了然

如果说2026年的折叠屏手机市场有版本答案的话，那肯定是大阔折手机了。是选择华为还是三星，今天我们就来看看两款大阔折的优势到底在哪。

标签：华为| 三星| 大阔折| 2026-07-31
一台手机能不能打职业？骁龙用七项数据回答了这个问题

当移动电竞的胜负以毫秒计算时，芯片就不再只是参数表上的一行字了。

标签：骁龙| 2026-07-31
苹果公布Q2季度财报 iPhone手机创纪录逆势增涨

苹果正式发布2026财年第三财季财报，在全球手机市场整体下滑的大环境下，苹果实现了逆势增长，并创造了新纪录。

标签：苹果| 财报| iPhone17| 增涨| 2026-07-31
8月11日发布 REDMI K100 Pro双旗舰满血性能

REDMI 正式官宣K100 Pro系列两款旗舰新机，将于8月11日举办新品发布会。官方介绍，该系列主打满血性能与满配游戏表现，屏幕、影像、续航三大核心板块均迎来全面升级。

标签： REDMI| REDMIK100Pro| 发布| 2026-07-31
2026上半年耳机市场持续走弱需求饱和内卷加剧

2026年上半年，中国耳机市场全渠道销量8797万副，同比下滑15.9%；销售额204亿元，同比下滑12.4%。市场量额双降，跌幅相较2025年进一步扩大。

标签：耳机| 2026-07-31
798克的笔记本？华为MateBook Pro S现场上手

华为又双叒叕创纪录了！华为MateBook Pro S，以11.9毫米厚度、798克重量再次刷新14英寸全金属超轻薄笔记本的极限！

标签：华为| MateBookProS| 超轻薄| 笔记本| 鸿蒙电脑| 2026-07-31
同级最大百变空间小米澎程N90实车体验

二三排秒变双人床、前排旋转秒变会客厅，7座满员还能塞7个行李箱+两辆自行车。第三排不再是“小板凳”，这才是家用SUV的终极形态？

标签：小米| 澎程| N90| SUV| 增程| 2026-07-31
万级七年长寿 OPPO A7 Pro Max创电池耐用传奇

我们收到了OPPO方面寄来的邀请函，OPPO方面将这款手机成为“机圈南孚”，有着拉满的电量表现。

标签： OPPO| OPPOA7ProMax| 电池| 耐用| 2026-07-31
小米澎程系列正式发布大七座增程N90 Max售29.99万元

7月30日晚，小米汽车正式发布全新澎程系列，推出N70 Max和N90 Max两款增程SUV，预售价分别为25.99万元和29.99万元。新车基于小米昆仑平台打造，主打纯平大空间、智能生态、安全与长续航，进一步布局家庭大型SUV市场。

标签：小米| 澎程| N70Max| N90Max| 增程| 2026-07-31
ChinaJoy 2026：REDMI独立参展 K100 Pro首秀

ChinaJoy 2026已于7月31日正式开幕，REDMI首次以独立品牌身份参展，展台不仅设置了丰富互动体验项目，观众还可现场上手体验将于8月发布的REDMI K100 Pro系列新机。

标签： ChinaJoy| REDMIK100Pro| REDMI| 2026-07-31