
Qwen紧追OpenAI开源4B端侧大模型,AIME25得分超越Claude 4 Opus
Qwen紧追OpenAI开源4B端侧大模型,AIME25得分超越Claude 4 Opus三天不开源,Qwen团队手就痒。 昨天深夜再次放出两个端侧模型: Qwen3-4B-Instruct-2507:非推理模型,大幅提升通用能力 Qwen3-4B-Thinking-2507:高级推理模型,专为专家级任务设计
三天不开源,Qwen团队手就痒。 昨天深夜再次放出两个端侧模型: Qwen3-4B-Instruct-2507:非推理模型,大幅提升通用能力 Qwen3-4B-Thinking-2507:高级推理模型,专为专家级任务设计
8月6号,真的今夕是何年了。 一晚上,三个我觉得都蛮大的货。
成立仅一年的初创公司Reflection AI 正洽谈融资逾 10 亿美元,用于开发开源大语言模型,与中国深度求索(DeepSeek)、法国 Mistral 及美国 Meta 等企业展开竞争。
知名AI大模型评测Chatbot Arena放榜!阿里Qwen3-235B-A22B-Instruct-2507位列大语言模型总榜第三,月之暗面Kimi-K2-0711-preview、深度求索DeepSeek-R1-0528并列为总榜第五,以开源之姿超越Claude 4、GPT-4.1等顶尖闭源模型。
家人们!燃起来了燃起来了! 今天,HuggingFace的开源大模型排行榜前10名中,竟有9个席位被中国模型占据!(深挖了一下,另外一位也是我们华人大神的项目)
专门适用超大模型、带来2.18倍推理加速,最新投机采样训练框架开源! SGLang团队联合美团搜推平台、Cloudsway.AI开源SpecForge。
前几天,Kimi 彻底开源了它的旗舰模型Kimi K2。不仅代码、权重全免费,还放出MIT许可,任企业随便商用。
模型落地中国芯取得关键突破!这得益于一个AI开源社区,以生态协作之力打通了AI落地的最后一公里。目前已有上千模型成功适配国产算力。从此,国产算力孤岛彻底打破,众多AI厂商积极上车,开发者狂喜!
「造芯」不易,「用芯」更难。大模型加速落地,国产芯片需求日盛,但模型真正能在国产芯上「开箱即用」者寥寥无几——这关键的「最后一公里」,谁来铺路?
奥特曼宣布无限期推迟OpenAI开源模型发布。与此同时,竞争对手正高调上新,开源赛道硝烟四起。这次跳票不仅令开发者和科技爱好者失望,也让外界再次质疑OpenAI在「Open」与商业利益之间的身份撕裂与信任危机。