
刚刚,DeepSeek开源FlashMLA,推理加速核心技术,Star量飞涨中
刚刚,DeepSeek开源FlashMLA,推理加速核心技术,Star量飞涨中上周五,DeepSeek 发推说本周将是开源周(OpenSourceWeek),并将连续开源五个软件库。第一个项目,果然与推理加速有关。北京时间周一上午 9 点,刚一上班(同时是硅谷即将下班的时候),DeepSeek 兑现了自己的诺言,开源了一款用于 Hopper GPU 的高效型 MLA 解码核:FlashMLA。
上周五,DeepSeek 发推说本周将是开源周(OpenSourceWeek),并将连续开源五个软件库。第一个项目,果然与推理加速有关。北京时间周一上午 9 点,刚一上班(同时是硅谷即将下班的时候),DeepSeek 兑现了自己的诺言,开源了一款用于 Hopper GPU 的高效型 MLA 解码核:FlashMLA。
算力需求比AdamW直降48%,OpenAI技术人员提出的训练优化算法Muon,被月之暗面团队又推进了一步!
还在担心被AI抢走饭碗?美国超1/3大学生已用ChatGPT写论文,70%企业雇主青睐具有AI技能的求职者。OpenAI用户数突破4亿,在职场和教育中掀起AI浪潮。
OpenAI o1视觉能力还是最强,模型们普遍“过于自信”!
Clay 集成了75+ 数据提供商(如 LinkedIn、Clearbit、Salesforce),并内置 AI Agent 进行客户研究、销售数据充实和个性化营销。通过无代码/低代码方式,用户可以拖拽式操作进行数据整合、自动化外联和个性化营销,提高业务增长效率。
结婚一年,奥特曼和丈夫共同迎来了首个宝宝,还是男孩!
OpenAI与微软的关系出现严重裂痕,主要原因是微软开始开发自己的大型语言模型,并聘请了Mustafa Suleyman,并且OpenAI首次使用非微软的数据中心。
OpenAI o1和DeepSeek-R1靠链式思维(Chain-of-Thought, CoT)展示了超强的推理能力,但这一能力能多大程度地帮助视觉推理,又应该如何细粒度地评估视觉推理呢?
AI组队自主开发时代来临!OpenAI Operator和Replit Agent组队编程,仅在5个提示90分钟内完成了应用程序的开发。
回应DeepSeek,阶跃星辰亮出“三件套”:开源,多模态推理,AI Agent。