全球首个,最接近原版DeepSeek开源复现来了!R1四个月狂飙26倍
全球首个,最接近原版DeepSeek开源复现来了!R1四个月狂飙26倍近日,来自SGLang、英伟达等机构的联合团队发了一篇万字技术报告:短短4个月,他们就让DeepSeek-R1在H100上的性能提升了26倍,吞吐量已非常接近DeepSeek官博数据!
来自主题: AI技术研报
11168 点击 2025-05-09 12:55
近日,来自SGLang、英伟达等机构的联合团队发了一篇万字技术报告:短短4个月,他们就让DeepSeek-R1在H100上的性能提升了26倍,吞吐量已非常接近DeepSeek官博数据!
Cursor,大家都知道吧。
我其实一直都很赞成AI的快速发展,很少会看到,让我眉头一皱的AI应用场景。
华为哈勃首次投资机器人公司千寻智能,5月将发新Demo。
央企通信巨头,牵头搞起了一个开源社区?
当您的Agent需要规划多步骤操作以达成目标时,比如游戏策略制定或旅行安排优化等等,传统规划方法往往需要复杂的搜索算法和多轮提示,计算成本高昂且效率不佳。来自Google DeepMind和CMU的研究者提出了一个简单却非常烧脑的问题:我们是否一直在用错误的方式选择示例来引导LLM学习规划?
多模态奖励模型(MRMs)在提升多模态大语言模型(MLLMs)的表现中起着至关重要的作用:
五一假期刚过,相信不少人已经在朋友圈的「人海直播」中深刻体会到了一个真理:出门旅游,光靠一腔热情远远不够。
外媒称,特朗普政府将撤销拜登时代《AI扩散框架》,取消AI芯片出口「三档」限制,并将提出简版规则,巩固美国AI创新地位。
智能体趋势真的爆了。