中文通用大模型评测基准SuperCLUE发布：讯飞星火大模型国内第一文心一言垫底最新消息

快科技5月9日消息，中文通用大模型综合性评测基准SuperCLUE正式发布。

中文通用大模型基准（SuperCLUE），是针对中文可用的通用大模型的一个测评基准，它尝试在一系列国内外代表性的模型上使用多个维度能力进行测试。

(资料图)

它主要回答的问题是：在当前通用大模型大力发展的情况下，中文大模型的效果情况。包括但不限于：这些模型不同任务的效果情况、相较于国际上的代表性模型做到了什么程度、这些模型与人类的效果对比如何？

根据首个榜单显示，国内大模型中，近期发布的星火认知大模型最好，总分53.58分，与GPT-4相比有23个百分点的差距，与gpt-3.5-turbo在总分上有13个百分点的差距。

值得一提的是，讯飞星火认知大模型在对话、百科知识、角色模拟、计算能力、语义理解、逻辑推理方面，已经达到GPT 3.5平齐的水准。

在语义理解方面，讯飞星火认知大模型甚至得到100分的满分，超过GPT-4。

而百度文心一言在总榜单中排名最后一名，得分32.61分。

据了解，SuperCLUE评测榜单由三部分组成：总榜单、基础能力榜单、中文特性榜单，排行榜会定期更新，可点此访问.

基础能力：包括了常见的有代表性的模型能力，如语义理解、对话、逻辑推理、角色模拟、代码、生成与创作等10项能力。

专业能力：包括了中学、大学与专业考试，涵盖了从数学、物理、地理到社会科学等50多项能力。

中文特性能力：针对有中文特点的任务，包括了中文成语、诗歌、文学、字形等10项多种能力。

总榜单

基础能力榜单

中文特性榜单

标签：

(责任编辑：news01)

什么是富时罗素概念_环球快资讯

1、富时罗素指数就是富时罗素发布的专门跟踪全球新兴市场指标的股指指数，富时罗素概念便是富时罗素概念股

05-07 09:46:01

全球实时：内蒙古为缴费人送出27亿元“政策红包”

为了激发市场活力，进一步促进高质量发展，2022年至2023年前四个月，通过调整地方水利建设基金计费依据及下

05-07 09:15:54

“倍加珍惜爱护优秀企业家”，才能壮大民营经济-天天信息

“倍加珍惜爱护优秀企业家”，才能壮大民营经济,大力,创业,民营经济

05-07 08:15:14

上离下艮详解图解上离下艮当前观察

今天来聊聊关于上离下艮详解图解，上离下艮的文章，现在就为大家来简单介绍下上离下艮详解图解，上离下艮，

05-07 06:50:20

2023年江阴市公开招聘教师面试有关事项公告

2023年江阴市公开招聘教师面试有关事项公告根据《2023年江阴市公开招聘教师公告》（澄人社事招公告核〔2023

05-07 05:04:23

人体骨骼解剖图谱（人体骨骼解剖图）

人体骨骼解剖图谱，人体骨骼解剖图这个很多人还不知道,现在让我们一起来看看吧！1、你想学好护理专业，说明

05-07 02:11:35

小米13 Ultra在酷安热度第一名：比万元机皇三星S23 Ultra还火

小米13Ultra在酷安热度第一名：比万元机皇三星S23Ultra还火

05-06 23:49:17

比尔·尼格兰：每个人都可以从沃伦巴菲特那里学到一些东西_当前信息

在该集团保险业务反弹的推动下，第一季度营业利润增长了12 6%

05-06 22:19:45

每日速读!4人专偷高压电线！被人发现就说是电力施工，作案15次后被抓

近日，湖南郴州桂阳县公安局刑侦大队经过缜密侦查，连续奋战，成功破获系列盗窃高压电线案15起，抓获犯罪嫌

05-06 21:10:14

科大讯飞发布讯飞星火认知大模型|微速讯

科大讯飞董事长刘庆峰、研究院院长刘聪发布讯飞星火认知大模型，并对大模型核心能力进行现场测试。在本次发

05-06 20:38:05

湖北第30届李时珍中药材交易会5月26日蕲春揭幕-热议

湖北第30届李时珍中药材交易会5月26日蕲春揭幕---湖北第30届李时珍中药材交易会5月26日蕲春揭幕

05-06 19:45:52

* OPPO F23 5G手机曝光：支持 67W 快充

5月6日，据《IT之家》报道，OPPO正准备于5月15日在印度发布新款OPPOF23Pro5G手机，将配备骁龙695芯片，预计

05-06 18:58:37

大连恒隆广场的升级法则：坚守高端、兼容多元化_当前最新

大连恒隆广场，收入急增40%撰文|陈羲龙排版|fufu图片来源|官方提供“在内地营商30多年，2022年大概是最不寻

05-06 18:25:44

全球热点评！天气预报｜未来三天多地有阵雨中心城区最高25

6日白天，重庆西部地区阴天间多云有分散阵雨，其余地区小雨到中雨，局地大雨，气温15~29& 176;C。根据重庆

05-06 17:54:51

世界新消息丨瓷器的种类和历史简介怎么写（瓷器的种类）

1、瓷器的分类法不止一种：有根据用途来分类的；有根据是否施釉来分类的；有根据瓷的性质来分类的。2、　　

05-06 17:11:50

南昌：停止向房企收取住房公积金贷款担保保证金世界热推荐

现停止向全市范围内房地产开发企业收取住房公积金贷款担保保证金。

05-06 16:36:49

“小巧而强大”ZBOX Q专业迷你工作站

对于设计工作者来说，选择一台兼具性能，外观，便携性的设备，能够有效地提高工作效率与创造力。时尚小巧的

05-06 16:04:00

当前播报:锦州推出十条措施激励干部勇于担当

容错纠错促担当、多岗历练强本领、精准培训夯基础……近日，锦州市委组织部推出十条举措激励干部在经济...

05-06 15:22:39

现在最火的网游排行榜前十名_现在最火的网游

1、现在最火的游戏有《英雄联盟》、《堡垒之夜》、《守望先锋》等。2、《英雄联盟》：市场流量份额26 42%。

05-06 14:47:54

富文本编辑器vue_富文本编辑器_环球微头条

1、富文本编辑器，RichTextEditor,简称RTE,是一种可内嵌于浏览器，所见即所得的文本编辑器。2、

05-06 14:02:11

中国四大名砚是那四种_全球热资讯

今天小编要和大家分享的是中国四大名砚是哪四种？希望能够帮助到大家。

05-06 13:39:40

全球快资讯丨全面颠覆行业生态！AI+建筑设计龙头一个月股价翻倍，受益上市公司梳理

财联社5月6日讯（编辑宣林）AI应用端盘面表现分化，AI+建筑设计方向展开加速补涨。启迪设计、新城市周五收

05-06 12:12:15

魂战天地_关于魂战天地简述

小伙伴们，你们好，今天小夏来聊聊一篇关于魂战天地，关于魂战天地简述的文章,网友们对这件事情都比较关注

05-06 11:45:30

京东2023出游季防晒产品迎来爆发防晒衣品类成交额同比超80%

近日，京东发布2023年春夏出游季消费数据。京东服饰春夏出游季及五一假期期间，防晒品类迎来爆发，其中防晒

05-06 11:19:06

易误诊！严重可致命，家里有孩子的注意！|世界快消息

福州市第一医院儿科副主任医师王健检查发现彤彤双侧颈部可以摸到数枚花生米大小的肿大淋巴结咽峡部有一个疱

05-06 10:43:58

美童工问题愈演愈烈，非法雇用童工激增69%

中国日报网5月5日电据哥伦比亚广播公司新闻网5月3日报道，美国劳工部一项调查发现，美国3家麦当劳特许经营

05-06 10:10:26

中国总领事会见巴厘岛警方讨论在巴旅游人身安全事宜!

音频解说中国总领事会见巴厘岛警方讨论在巴旅游人身安全事宜!今天的关注度非常高，直接上了热搜榜，那么具

05-06 10:01:43

天天时讯：【百家读城】天长地久绥芬河

郡县治则天下安，县域兴则国家强。聚焦中国县域，展望宏伟蓝图。大家好，我是葛均义，现在由我为大家读城。

05-06 09:26:05

俄外长：将对无人机袭击事件作出回应|世界时讯

俄罗斯外长拉夫罗夫5号在印度果阿出席上海合作组织成员国外长会期间表示，无人机袭击克林姆林宫事件不可能

05-06 08:43:09

举报“车窗抛物” 查实一条奖励50元

举报“车窗抛物”查实一条奖励50元

05-06 07:45:01

中文通用大模型评测基准SuperCLUE发布：讯飞星火大模型国内第一 文心一言垫底 最新消息

为您推荐

中文通用大模型评测基准SuperCLUE发布：讯飞星火大模型国内第一文心一言垫底最新消息