AI资讯新闻榜单内容搜索-专家模型

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 专家模型

华为：让DeepSeek的“专家们”动起来，推理延迟降10%！

华为：让DeepSeek的“专家们”动起来，推理延迟降10%！

华为：让DeepSeek的“专家们”动起来，推理延迟降10%！

要问最近哪个模型最火，混合专家模型（MoE，Mixture of Experts）绝对是榜上提名的那一个。

来自主题: AI技术研报

9331 点击 2025-05-20 15:16

颜水成领衔，给AI分段位！超100款多模态模型，无人达到L5

颜水成领衔，给AI分段位！超100款多模态模型，无人达到L5

颜水成领衔，给AI分段位！超100款多模态模型，无人达到L5

理想中的多模态大模型应该是什么样？十所顶尖高校联合发布General-Level评估框架和General-Bench基准数据集，用五级分类制明确了多模态通才模型的能力标准。当前多模态大语言模型在任务支持、模态覆盖等方面存在不足，且多数通用模型未能超越专家模型，真正的通用人工智能需要实现模态间的协同效应。

来自主题: AI技术研报

10111 点击 2025-05-19 17:08

一文详解：DeepSeek 第三天开源的 DeepGEMM

一文详解：DeepSeek 第三天开源的 DeepGEMM

一文详解：DeepSeek 第三天开源的 DeepGEMM

DeepSeek 开源周的第三天，带来了专为 Hopper 架构 GPU 优化的矩阵乘法库 — DeepGEMM。这一库支持标准矩阵计算和混合专家模型（MoE）计算，为 DeepSeek-V3/R1 的训练和推理提供强大支持，在 Hopper GPU 上达到 1350+FP8 TFLOPS 的高性能。

来自主题: AI技术研报

7933 点击 2025-02-26 10:46

一文详解：DeepSeek 第二天开源的 DeepEP

一文详解：DeepSeek 第二天开源的 DeepEP

一文详解：DeepSeek 第二天开源的 DeepEP

DeepSeek 本周正在连续 5 天发布开源项目，今天是第 2 天，带来了专为混合专家模型（MoE）和专家并行（EP）打造的高效通信库 — DeepEP。就在半小时前，官方对此进行了发布，以下是由赛博禅心带来的详解。

来自主题: AI技术研报

9834 点击 2025-02-25 11:18

阿里云通义大模型新技术：MoE模型训练专家平衡的关键细节

阿里云通义大模型新技术：MoE模型训练专家平衡的关键细节

阿里云通义大模型新技术：MoE模型训练专家平衡的关键细节

本周，在阿里云通义千问 Qwen 团队提交的一篇论文中，研究人员发现了目前最热门的 MoE（混合专家模型）训练中存在的一个普遍关键问题，并提出一种全新的方法——通过轻量的通信将局部均衡放松为全局均衡，使得 MoE 模型的性能和专家特异性都得到了显著的提升。

来自主题: AI技术研报

4570 点击 2025-01-26 11:12

LeCun八年前神预言，大模型路线再颠覆？OpenAI宣告：强化学习取得稳定性突破

LeCun八年前神预言，大模型路线再颠覆？OpenAI宣告：强化学习取得稳定性突破

LeCun八年前神预言，大模型路线再颠覆？OpenAI宣告：强化学习取得稳定性突破

只需几十个样本即可训练专家模型，强化微调RLF能掀起强化学习热潮吗？具体技术实现尚不清楚，AI2此前开源的RLVR或许在技术思路上存在相似之处。

来自主题: AI资讯

8653 点击 2024-12-23 15:58

OpenAI的强化微调：RL+Science 创造新神还是灭霸？

OpenAI的强化微调：RL+Science 创造新神还是灭霸？

OpenAI的强化微调：RL+Science 创造新神还是灭霸？

2024 年 12 月 6 号加州时间上午 11 点，OpenAI 发布了新的 Reinforcement Finetuning 方法，用于构造专家模型。对于特定领域的决策问题，比如医疗诊断、罕见病诊断等等，只需要上传几十到几千条训练案例，就可以通过微调来找到最有的决策。

来自主题: AI技术研报

8156 点击 2024-12-08 14:19

OpenAI 12连发第2弹：强化微调，少量样本就能训练自己的专家模型

OpenAI 12连发第2弹：强化微调，少量样本就能训练自己的专家模型

OpenAI 12连发第2弹：强化微调，少量样本就能训练自己的专家模型

强化微调可以轻松创建具备强大推理能力的专家模型。

来自主题: AI技术研报

8615 点击 2024-12-07 11:46

OpenAI强化微调登场：几十条数据o1-mini反超o1暴涨80%，奥特曼：今年最大惊喜

OpenAI强化微调登场：几十条数据o1-mini反超o1暴涨80%，奥特曼：今年最大惊喜

OpenAI强化微调登场：几十条数据o1-mini反超o1暴涨80%，奥特曼：今年最大惊喜

OpenAI“双12”直播第二天，依旧简短精悍，主题：新功能强化微调（Reinforcement Fine-Tuning），使用极少训练数据即在特定领域轻松地创建专家模型。少到什么程度呢？最低几十个例子就可以。

来自主题: AI资讯

10741 点击 2024-12-07 09:26

专家模型不要专家并行！微软开源MoE新路径

专家模型不要专家并行！微软开源MoE新路径

专家模型不要专家并行！微软开源MoE新路径

近日，来自微软的研究人员开源了使用全新方法训练的MoE大模型，不走寻常路，且编码和数学表现出色。

来自主题: AI技术研报

7474 点击 2024-11-11 15:15

上一页当前第2页,共4页下一页