强化学习Scaling Law错了?无需蒸馏,数据量只要1/6,效果还更好
强化学习Scaling Law错了?无需蒸馏,数据量只要1/6,效果还更好强化学习训练数据越多,模型推理能力就越强?新研究提出LIM方法,揭示提升推理能力的关键在于优化数据质量,而不是数据规模。该方法在小模型上优势尽显。从此,强化学习Scaling Law可能要被改写了!
强化学习训练数据越多,模型推理能力就越强?新研究提出LIM方法,揭示提升推理能力的关键在于优化数据质量,而不是数据规模。该方法在小模型上优势尽显。从此,强化学习Scaling Law可能要被改写了!
国产AI几何模型性能达IMO金牌水平,打平谷歌DeepMind最新AlphaGeometry系列——
四万字深聊DeepSeek!2025年1月底在媒体聚集的达沃斯论坛上,微软CEO Satya Nadella以及Scale AI创始人Alexandr Wang的发言直接将DeepSeek推到风口浪尖...
接入DeepSeek,不等于All in DeepSeek
Scale AI 等提出的新基准再次暴露了大语言模型的弱点。
据外媒披露,人形机器人初创公司Figure AI正在洽谈新一轮15亿美元融资,公司估值高达395亿美元。Figure本轮融资预计将由Align Ventures和Parkway Venture Capital领投。
英伟达巧妙地将DeepSeek-R1与推理时扩展相结合,构建了全新工作流程,自动优化生成GPU内核,取得了令人瞩目的成果。
自一月以来, DeepSeek 在 AI 领域引发了极大的热度,也出现了大量分析文章。其中来自 Leonis Capital 于 2.6 发表于 Substack 上的文章:「DeepSeek: A Technical and Strategic Analysis for VCs and Startups」
蒸馏模型的性能可以量化估算了。
三星发布Galaxy S25系列,强调AI功能和数据安全。