AI资讯新闻榜单内容搜索-开源大模型

Qwen3小升级即SOTA，开源大模型王座快变中国内部赛了

开源大模型正在进入中国时间。 Kimi K2风头正盛，然而不到一周，Qwen3就迎来最新升级，235B总参数量仅占Kimi K2 1T规模的四分之一。基准测试性能上却超越了Kimi K2。

来自主题: AI资讯

8458 点击 2025-07-22 15:02

Kimi K2模型API性能优化进行时：月之暗面积极应对高负载挑战

近日，月之暗面(Moonshot AI)正式发布了其万亿参数开源大模型Kimi K2，这一具有里程碑意义的AI模型凭借其创新的MoE架构和强大的Agentic能力迅速获得全球开发者关注。然而，随着用户量激增，部分开发者开始反映其API服务响应速度不尽如人意。面对这一情况，月之暗面于7月15日迅速作出官方回应，坦诚当前服务延迟问题，并详细说明了优化方案。

来自主题: AI资讯

10093 点击 2025-07-21 12:18

刚刚！华为首个开源大模型来了

刚刚，华为正式宣布开源盘古 70 亿参数的稠密模型、盘古 Pro MoE 720 亿参数的混合专家模型（参见机器之心报道：华为盘古首次露出，昇腾原生72B MoE架构，SuperCLUE千亿内模型并列国内第一）和基于昇腾的模型推理技术。

来自主题: AI资讯

11214 点击 2025-06-30 09:19

中国首个海洋领域开源大模型OceanGPT(沧渊)发布！海洋精准感知技术全国重点实验室(浙江大学)牵头研发

该大模型由海洋精准感知技术全国重点实验室(浙江大学)牵头研发，具备基础的海洋专业知识问答，以及声呐图像、海洋观测图等海洋特色多模态数据的自然语言解读能力。其采用的领域知识增强“慢思考”推理机制，相较现有通用大模型能有效降低幻觉式错误。

来自主题: AI资讯

8003 点击 2025-06-29 17:03

不再担心AI“健忘”，北邮团队开源大模型记忆操作系统

随着大模型应用场景的不断拓展，其在处理长期对话时逐渐暴露出的记忆局限性日益凸显，主要表现为固定长度上下文窗口导致的“健忘”问题。

来自主题: AI资讯

10309 点击 2025-06-18 16:32

“Qwen3之后，我才真正敢投AI应用”

2025年4月29日凌晨，距离通义千问Qwen3正式发布还有5小时，X和GitHub上的开发者们已经搬好小板凳蹲守发布。开源社区的技术爱好者们熬夜刷新，等待第一时间测试和体验这款备受期待的中国大模型新作。

来自主题: AI资讯

10014 点击 2025-05-01 13:57

Qwen3真香！通义App满血接入，一手实测在此

开源大模型新王者，正在受到空前关注。

来自主题: AI产品测评

11431 点击 2025-04-30 19:40

终端云端三连发！无问芯穹开源大模型推理加速神器，加码构建新一代端、云推理系统

近日，无问芯穹发起了一次推理系统开源节，连续开源了三个推理工作，包括加速端侧推理速度的 SpecEE、计算分离存储融合的 PD 半分离调度新机制 Semi-PD、低计算侵入同时通信正交的计算通信重叠新方法 FlashOverlap，为高效的推理系统设计提供多层次助力。下面让我们一起来对这三个工作展开一一解读：

来自主题: AI技术研报

10558 点击 2025-04-30 08:50

深夜突袭，阿里Qwen3登顶全球开源王座！暴击DeepSeek-R1，2小时狂揽17k星

阿里Qwen3凌晨开源，正式登顶全球开源大模型王座！它的性能全面超越DeepSeek-R1和OpenAI o1，采用MoE架构，总参数235B，横扫各大基准。这次开源的Qwen3家族，8款混合推理模型全部开源，免费商用。

来自主题: AI资讯

11624 点击 2025-04-29 08:49

途牛“AI助手小牛”正式上线

4月1日，途牛旅游网自主研发的“AI助手小牛”旅游应用Agent正式上线途牛旅游APP、“AI助手小牛”小程序。“AI助手小牛”结合旅行垂直应用场景与开源大模型（DeepSeek、通义千问），实现了机票、酒店、火车票快捷查询、预订服务，能够为用户提供智能、专业的“0搭售"旅游服务方案。

来自主题: AI资讯

10003 点击 2025-04-02 09:33