
DeepSeek开源放大招:FlashMLA让H800算力狂飙!曝光低成本秘笈
DeepSeek开源放大招:FlashMLA让H800算力狂飙!曝光低成本秘笈DeepSeek开源周第一天就放大招!FlashMLA强势登场,这是专为英伟达Hopper GPU打造MLA解码内核。注意,DeepSeek训练成本极低的两大关键,一个是MoE,另一个就是MLA。
DeepSeek开源周第一天就放大招!FlashMLA强势登场,这是专为英伟达Hopper GPU打造MLA解码内核。注意,DeepSeek训练成本极低的两大关键,一个是MoE,另一个就是MLA。
导师认为,他无需使用AI也能通过考试。
算力需求比AdamW直降48%,OpenAI技术人员提出的训练优化算法Muon,被月之暗面团队又推进了一步!
DeepSeek彻底引爆大模型应用落地。
2 月 18 日,月之暗面发布了一篇关于稀疏注意力框架 MoBA 的论文。MoBA 框架借鉴了 Mixture of Experts(MoE)的理念,提升了处理长文本的效率,它的上下文长度可扩展至 10M。并且,MoBA 支持在全注意力和稀疏注意力之间无缝切换,使得与现有的预训练模型兼容性大幅提升。
GitHub上一个开源项目彻底打破门槛:只需3块钱、2小时,普通人也能从零训练自己的语言模型!项目“MiniMind”上线即爆火,狂揽8.9k星标,技术圈直呼:“这才是AI民主化的未来!”
2月18日,上海交通大学医学院附属瑞金医院举办了“2025医疗人工智能与精准诊疗发展论坛”,瑞金医院携手华为共同发布瑞智病理大模型RuiPath。
在AI计算资源日益稀缺的时代,Lambda凭借其独特的云GPU解决方案迅速崛起,成为资本市场的宠儿。最近,这家成立于2012年的AI云计算公司宣布完成4.8亿美元D轮融资,累计融资额达到8.63亿美元,跻身AI创投榜云科技赛道第二位,仅次于Coreweave。此次投资阵容强大,包括英伟达、AI技术大牛Andrej Karpathy,以及和硕、超微、纬创、纬颖等行业巨头的战略入股。
8999!比iPhone 16 Pro还贵,史上起售价最高的国产安卓AI手机来了!
据 TechCrunch 报道,Codeium是一家由人工智能驱动的编码初创公司,正在以 28.5 亿美元的估值进行新一轮融资,包括新资金。这轮融资由投资者 Kleiner Perkins 主导,知情人士表示。