AI资讯新闻榜单内容搜索-SuperCLUE

登顶SuperCLUE DeepSearch，openPangu-R-72B深度搜索能力跃升

近日，第三方评测机构 SuperCLUE 发布 11 月 DeepSearch 评测报告，国产大模型 openPangu-R-72B 凭借在长链推理、复杂信息检索领域的卓越表现，在模型榜单中名列第一，体现了基于国产昇腾算力的大模型研发实力。

来自主题: AI资讯

9138 点击 2025-12-06 11:23

华为盘古718B模型最新成绩：开源第二

就在最新一期的SuperCLUE中文大模型通用基准测评中，各个AI大模型玩家的成绩新鲜出炉。DeepSeek-V3.1-Terminus-Thinking openPangu-Ultra-MoE-718B Qwen3-235B-A22B-Thinking-2507

来自主题: AI资讯

9364 点击 2025-09-29 22:10

SuperCLUE推理榜惊现黑马：原来中兴是一家AI公司？

中兴通讯，这家数万人的科技大厂，凭借40年 ICT 技术积累正式进军 AI 赛道。一家信息通信公司，居然拿到了 AI 推理竞赛的冠军，这事儿有点意思。

来自主题: AI资讯

8143 点击 2025-07-01 15:53

刚刚！华为首个开源大模型来了

刚刚，华为正式宣布开源盘古 70 亿参数的稠密模型、盘古 Pro MoE 720 亿参数的混合专家模型（参见机器之心报道：华为盘古首次露出，昇腾原生72B MoE架构，SuperCLUE千亿内模型并列国内第一）和基于昇腾的模型推理技术。

来自主题: AI资讯

11213 点击 2025-06-30 09:19

中兴星云拿下推理总分榜一！SuperCLUE 5月成绩出炉

就在刚刚，中兴通讯星云大模型获推理榜总分第一，总榜并列第二！而在数学推理、科学推理、代码生成的细分赛道上，它同样表现抢眼。更难得的是，它是业内少数通过国家级权威安全认证的大模型。

来自主题: AI资讯

10097 点击 2025-05-31 11:40

中文大模型幻觉测评系列：事实性幻觉测评结果发布！

SuperCLUE-Fact是专门评估大语言模型在中文短问答中识别和应对事实性幻觉的测试基准。测评任务包括知识、常识、对抗性和上下文幻觉。

来自主题: AI资讯

14026 点击 2025-04-15 17:04

最强国产多模态刚刚易主！腾讯混元把GPT-4/Claude-3.5/Gemini-1.5都超了

国产大模型，多模态能力都开始超越GPT-4-Turbo了？？

来自主题: AI资讯

12442 点击 2024-08-08 14:51

大模型常用评测基准汇总

基于评测维度，考虑到各评测集关注的评测维度，可以将其划分为通用评测基准和具体评测基准。

来自主题: AI资讯

14676 点击 2024-07-23 19:24

GPT-4 Turbo首次被击败！国产大模型拿下总分第一

OpenAI长期霸榜的SuperCLUE（中文大模型测评基准），终于被国产大模型反将一军。

来自主题: AI资讯

9427 点击 2024-05-22 18:17

6款通用大模型在保险行业的能力PK测评报告｜ZionAI实验室大模型测评

参照SuperCLUE（中文通用大模型综合性测评基准）框架专门定制了1000道题目集，一一测试了ChatGPT4、智谱chatGLM-4、Baichuan2-Turbo、百度ERNIE-Bot 4.0、Yi-34B-chat、llama 2等模型在保险业务上的表现。

来自主题: AI资讯

10746 点击 2024-03-07 10:34

AI资讯新闻榜单内容搜索-SuperCLUE

登顶SuperCLUE DeepSearch，openPangu-R-72B深度搜索能力跃升

华为盘古718B模型最新成绩：开源第二

SuperCLUE推理榜惊现黑马：原来中兴是一家AI公司？

刚刚！华为首个开源大模型来了

中兴星云拿下推理总分榜一！SuperCLUE 5月成绩出炉

中文大模型幻觉测评系列：事实性幻觉测评结果发布！

最强国产多模态刚刚易主！腾讯混元把GPT-4/Claude-3.5/Gemini-1.5都超了

大模型常用评测基准汇总

GPT-4 Turbo首次被击败！国产大模型拿下总分第一

6款通用大模型在保险行业的能力PK测评报告 ｜ZionAI实验室大模型测评

6款通用大模型在保险行业的能力PK测评报告｜ZionAI实验室大模型测评