加入收藏

上交清华联合发布大模型排行榜 360智脑跑赢GPT-4

2023-09-01 11:18:04 来源:金融界


(资料图片仅供参考)

为辅助国内开发者研发中文大模型,近期,上海交通大学联合清华大学及爱丁堡大学共同构造了适用于大语言模型的多层次多学科中文评估套件“C-Eval”,并被认作为目前最主流且认可度最高的中文预训练评估任务。在该项目组最新公布的中文大模型能力排行榜上,360智脑大模型的千亿参数版本“360GPT-S2”平均分得分超过GPT-4,尤其在社会科学及人文科学两项上表现优异。

据了解,C-Eval是全面的中文基础模型评估套件,覆盖人文,社科,理工,其他专业四个大方向,52个学科(含微积分、线代等),题目范畴涵盖中学到大学研究生以及职业考试,共计13948 道题目的中文知识和推理型测试集。

根据官方公布的结果显示,360智脑大模型的千亿参数版本“360GPT-S2”平均分得分为69分,不仅超过GPT-4的平均分,并在社会科学类题目中得分82分,超过GPT-4近5分,人文科学类题目中得分70.6分,比GPT-4该项得分高6分。业内人士评价,以360智脑为代表的国产大模型能力全面超越GPT-4,标志着国产大模型已实现弯道超车。

对此,360智脑业务负责人表示,360智脑在社会科学类及人文科学类评估问题上获得高分成绩,主要取决于360GPT预训练时的高质量且多样性的语料。依托于360搜索11年多的数据积累,360搜索积累了上万亿网页以及完善的数据过滤和清洗手段,并成为360智脑大模型的天然数据优势,同技术优势、搜索增强优势、工程化优势、场景优势、内容安全优势、大模型安全优势、算力优势等八大优势一起,助力360智脑大模型能力不断升级。过去1个月内,360智脑在整体性能提升14.55%,COT能力提升69%,进一步实现可支持50000+字的更长文本输入,并将多轮对话长度提升了18%。

由于360在大模型技术和实践上的积累,360智脑成为中国首个通过工信部信通院认可的“可信AIGC大模型评测”大模型。同时,360被工信部中国电子技术标准化研究院授予“国家人工智能标准化总体组大模型专题组”组长单位,参与大模型国家标准制订,为推动我国大模型产业发展贡献“国家队”力量。

项目组官方表示,知识和推理能力是大模型真正在工业界立生落地的关键。业内人士指出,360智脑的高分上榜标志着其产业落地能力已领跑业界。凭借领先的AI技术,360已于6月推出企业级AI大模型解决方案,并在近20个行业进行落地,全面助力产业数字化转型升级。据刚刚出炉的财报披露,2023年上半年,360智脑大模型已为360创造近2000万元相关业务收入,业务势头强劲,并成为与360数字安全双轨并行的主线业务。

本文源自:金融界资讯

关键词:

相关新闻

资讯

科技赋能 广西北海推动营商环境持续优化提升
科技赋能 广西北海推动营商环境持续优化提升

科技日报记者刘昊8月29日,广西壮族自治区党委宣传部......更多>

武汉市狮子山街道:以学促干 提升履职能力
武汉市狮子山街道:以学促干 提升履职能力

“这次的培训让我受益匪浅,执纪问责全过程的剖析能够......更多>

巨人网络发布2023中报:营收14.43亿元 同比增长35.68%
巨人网络发布2023中报:营收14.43亿元 同比增长35.68%

8月31日,巨人网络发布了2023中报,报告期内营收、利......更多>

楚江新材(002171):23Q2业绩环比改善 3D打印结构件形成批量交付
楚江新材(002171):23Q2业绩环比改善 3D打印结构件形成批量交付

楚江新材(002171):23Q2业绩环比改善3D打印结构件形成批量交付...更多>

金庸小说改编 网易自研游戏《射雕》:世界仅此一服 不逼肝、不逼氪
金庸小说改编 网易自研游戏《射雕》:世界仅此一服 不逼肝、不逼氪

金庸小说改编网易自研游戏《射雕》:世界仅此一服不逼......更多>

诺兰与奥本海默
诺兰与奥本海默

理解奥本海默的复杂,就要理解他作为科学家和潜在政治......更多>

复星医药董事长吴以芳谈开放式创新:不设限制旨在双赢
复星医药董事长吴以芳谈开放式创新:不设限制旨在双赢

由于研发成本高、时间长,对于创新药企而言,扭亏是企......更多>

服务制造业绿色转型,兴业银行东莞分行多举措“贷”动绿色金融
服务制造业绿色转型,兴业银行东莞分行多举措“贷”动绿色金融

服务制造业绿色转型,兴业银行东莞分行多举措“贷”动......更多>

兰州已公布三项城市公交调价方案:公交运营陷入长期亏损困境
兰州已公布三项城市公交调价方案:公交运营陷入长期亏损困境

即将于9月8日召开城市公交票价调整听证会的甘肃省会兰......更多>

关注

中央气象台8月31日18时继续发布暴雨黄色预警
中央气象台8月31日18时继续发布暴雨黄色预警
中央气象台8月31日18时继续发布暴雨黄色预警:预计,8... 更多>
中央气象台8月31日18时继续发布暴雨黄色预警
中央气象台8月31日18时继续发布暴雨黄色预警:预计,8... 更多>
《幻塔》小罐蓝莓在什么位置
幻塔是非常经典的角色扮演游戏,无论是老玩家还是新玩... 更多>
服贸会|北京西城展区:“互动体验”展示发展新活力
原标题:服贸会|北京西城展区:“互动体验”展示发展... 更多>
pvc软管(关于pvc软管的基本详情介绍)
pvc软管,vc软管的基本详情介绍很多人还不知道,那么... 更多>
抖音电商发布商品卡免佣扶持政策规则
8月31日消息,抖音电商发布商品卡免佣扶持政策规则,... 更多>
托奇克 托奇
1、托奇应该有领悟无想转生的可能的,如果他没有过早... 更多>
12个!第二批美丽海湾优秀案例发布
12个!第二批美丽海湾优秀案例发布---中国经济网北京8... 更多>
滨江区:星光气球小屋于近日正式开放
01:29为更好地服务杭州亚运会,展现杭城志愿者们的良... 更多>
【流浪自然】营口惊现“黑海水”,是核污水来了吗?别慌,是老朋友浒苔……
昨天有媒体报道,辽宁营口山海广场附近海域的海水呈黑... 更多>
年度大片《开学》震撼上映!这份安全指南请收好
由《暑假》原班人马倾情奉献的2023年秋季大片——《开... 更多>
江山欧派(603208.SH)获得政府补助3153.19万元
智通财经APP讯,江山欧派(603208)(603208 SH)发布公... 更多>
菜鸟(关于菜鸟简述)
,你们好,今天0471房产来聊聊一篇鸟,鸟简述的文章,... 更多>