AI资讯新闻榜单内容搜索-SuperCLUE

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: SuperCLUE
华为盘古718B模型最新成绩:开源第二

华为盘古718B模型最新成绩:开源第二

华为盘古718B模型最新成绩:开源第二

就在最新一期的SuperCLUE中文大模型通用基准测评中,各个AI大模型玩家的成绩新鲜出炉。DeepSeek-V3.1-Terminus-Thinking openPangu-Ultra-MoE-718B Qwen3-235B-A22B-Thinking-2507

来自主题: AI资讯
6575 点击    2025-09-29 22:10
SuperCLUE推理榜惊现黑马:原来中兴是一家AI公司?

SuperCLUE推理榜惊现黑马:原来中兴是一家AI公司?

SuperCLUE推理榜惊现黑马:原来中兴是一家AI公司?

中兴通讯,这家数万人的科技大厂,凭借40年 ICT 技术积累正式进军 AI 赛道。 一家信息通信公司,居然拿到了 AI 推理竞赛的冠军,这事儿有点意思。

来自主题: AI资讯
6143 点击    2025-07-01 15:53
刚刚!华为首个开源大模型来了

刚刚!华为首个开源大模型来了

刚刚!华为首个开源大模型来了

刚刚,华为正式宣布开源盘古 70 亿参数的稠密模型、盘古 Pro MoE 720 亿参数的混合专家模型(参见机器之心报道:华为盘古首次露出,昇腾原生72B MoE架构,SuperCLUE千亿内模型并列国内第一 )和基于昇腾的模型推理技术。

来自主题: AI资讯
8838 点击    2025-06-30 09:19
中兴星云拿下推理总分榜一!SuperCLUE 5月成绩出炉

中兴星云拿下推理总分榜一!SuperCLUE 5月成绩出炉

中兴星云拿下推理总分榜一!SuperCLUE 5月成绩出炉

就在刚刚,中兴通讯星云大模型获推理榜总分第一,总榜并列第二!而在数学推理、科学推理、代码生成的细分赛道上,它同样表现抢眼。更难得的是,它是业内少数通过国家级权威安全认证的大模型。

来自主题: AI资讯
8008 点击    2025-05-31 11:40
中文大模型幻觉测评系列:事实性幻觉测评结果发布!

中文大模型幻觉测评系列:事实性幻觉测评结果发布!

中文大模型幻觉测评系列:事实性幻觉测评结果发布!

SuperCLUE-Fact是专门评估大语言模型在中文短问答中识别和应对事实性幻觉的测试基准。测评任务包括知识、常识、对抗性和上下文幻觉。

来自主题: AI资讯
9314 点击    2025-04-15 17:04
大模型常用评测基准汇总

大模型常用评测基准汇总

大模型常用评测基准汇总

基于评测维度,考虑到各评测集关注的评测维度,可以将其划分为通用评测基准和具体评测基准。

来自主题: AI资讯
11391 点击    2024-07-23 19:24
GPT-4 Turbo首次被击败!国产大模型拿下总分第一

GPT-4 Turbo首次被击败!国产大模型拿下总分第一

GPT-4 Turbo首次被击败!国产大模型拿下总分第一

OpenAI长期霸榜的SuperCLUE(中文大模型测评基准),终于被国产大模型反将一军。

来自主题: AI资讯
7341 点击    2024-05-22 18:17
6款通用大模型在保险行业的能力PK测评报告 |ZionAI实验室大模型测评

6款通用大模型在保险行业的能力PK测评报告 |ZionAI实验室大模型测评

6款通用大模型在保险行业的能力PK测评报告 |ZionAI实验室大模型测评

参照SuperCLUE(中文通用大模型综合性测评基准)框架专门定制了1000道题目集,一一测试了ChatGPT4、 智谱chatGLM-4、Baichuan2-Turbo、百度ERNIE-Bot 4.0、Yi-34B-chat、llama 2等模型在保险业务上的表现。

来自主题: AI资讯
8088 点击    2024-03-07 10:34
最强端侧模型,面壁MiniCPM位列SuperClue榜单表现前列

最强端侧模型,面壁MiniCPM位列SuperClue榜单表现前列

最强端侧模型,面壁MiniCPM位列SuperClue榜单表现前列

随着终端侧 AI 变革席卷全球,「小而强」的端侧大模型,成为行业主流玩家的必争之地。

来自主题: AI资讯
4655 点击    2024-03-03 09:43