AI资讯新闻榜单内容搜索-deepseek-r

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: deepseek-r

啪啪打脸！Search-R1让DeepSeek-R1实时获取信息，实现26%提升的争议与启发 | 最新

啪啪打脸！Search-R1让DeepSeek-R1实时获取信息，实现26%提升的争议与启发 | 最新

啪啪打脸！Search-R1让DeepSeek-R1实时获取信息，实现26%提升的争议与启发 | 最新

本文介绍了Search-R1技术，这是一项通过强化学习训练大语言模型进行推理并利用搜索引擎的创新方法。实验表明，Search-R1在Qwen2.5-7B模型上实现了26%的性能提升，使模型能够实时获取准确信息并进行多轮推理。本文详细分析了Search-R1的工作原理、训练方法和实验结果，为AI产品开发者提供了重要参考。

来自主题: AI技术研报

12324 点击 2025-03-20 09:48

老黄发布新核弹B300，英伟达：B200已破DeepSeek-R1推理世界纪录

老黄发布新核弹B300，英伟达：B200已破DeepSeek-R1推理世界纪录

老黄发布新核弹B300，英伟达：B200已破DeepSeek-R1推理世界纪录

皮衣老黄，带着最强AI芯片GB300闪亮登场“AI超级碗”GTC，燃爆全场！

来自主题: AI资讯

7372 点击 2025-03-19 12:32

全球首个工业界多模态推理模型开源！38B硬刚DeepSeek-R1，训练秘籍全公开

全球首个工业界多模态推理模型开源！38B硬刚DeepSeek-R1，训练秘籍全公开

全球首个工业界多模态推理模型开源！38B硬刚DeepSeek-R1，训练秘籍全公开

全球首个开源多模态推理大模型来了！38B参数模型性能直逼DeepSeek-R1，同尺寸上横扫多项SOTA。而这家中国公司之所以选择无偿将技术思路开源，正是希望同DeepSeek一样，打造开源界的技术影响力。

来自主题: AI技术研报

11814 点击 2025-03-18 19:19

迁移DeepSeek-R1同款算法，小米让7B模型登顶音频理解推断MMAU榜单

迁移DeepSeek-R1同款算法，小米让7B模型登顶音频理解推断MMAU榜单

迁移DeepSeek-R1同款算法，小米让7B模型登顶音频理解推断MMAU榜单

7B小模型+3.8万条训练数据，就能让音频理解和推断评测基准MMAU榜单王座易主？

来自主题: AI技术研报

4849 点击 2025-03-17 10:52

27个大模型混战电商领域，DeepSeek-R1&V3仍是最强丨首个中文电商问答基准评估结果

27个大模型混战电商领域，DeepSeek-R1&V3仍是最强丨首个中文电商问答基准评估结果

27个大模型混战电商领域，DeepSeek-R1&V3仍是最强丨首个中文电商问答基准评估结果

全面评估大模型电商领域能力，首个聚焦电商基础概念的可扩展问答基准来了！

来自主题: AI技术研报

10174 点击 2025-03-16 13:41

出海应用也能享受高速稳定的DeepSeek-R1？亚马逊云科技出手了

出海应用也能享受高速稳定的DeepSeek-R1？亚马逊云科技出手了

出海应用也能享受高速稳定的DeepSeek-R1？亚马逊云科技出手了

给大模型落地，加入极致的务实主义。

来自主题: AI技术研报

9804 点击 2025-03-14 16:35

MM-Eureka：极少数据实现多模态推理的R1-Zero时刻

MM-Eureka：极少数据实现多模态推理的R1-Zero时刻

MM-Eureka：极少数据实现多模态推理的R1-Zero时刻

尽管 DeepSeek-R1 在单模态推理中取得了显著成功，但已有的多模态尝试（如 R1-V、R1-Multimodal-Journey、LMM-R1）尚未完全复现其核心特征。

来自主题: AI技术研报

8950 点击 2025-03-14 15:32

DeepSeek“防弹衣”来了，模型内生安全加固方案，拒绝杀敌一千自损八百｜上海AI Lab

DeepSeek“防弹衣”来了，模型内生安全加固方案，拒绝杀敌一千自损八百｜上海AI Lab

DeepSeek“防弹衣”来了，模型内生安全加固方案，拒绝杀敌一千自损八百｜上海AI Lab

最新研究显示，以超强推理爆红的DeepSeek-R1模型竟藏隐形危险——

来自主题: AI技术研报

10840 点击 2025-03-13 14:53

超越DeepSeek-R1关键RL算法GRPO，CMU「元强化微调」新范式登场

超越DeepSeek-R1关键RL算法GRPO，CMU「元强化微调」新范式登场

超越DeepSeek-R1关键RL算法GRPO，CMU「元强化微调」新范式登场

大语言模型（LLM）在推理领域的最新成果表明了通过扩展测试时计算来提高推理能力的潜力，比如 OpenAI 的 o1 系列。

来自主题: AI技术研报

8933 点击 2025-03-13 14:41

32B IOI奥赛击败DeepSeek-R1！Open R1开源复刻第三弹，下一步R1-Zero

32B IOI奥赛击败DeepSeek-R1！Open R1开源复刻第三弹，下一步R1-Zero

32B IOI奥赛击败DeepSeek-R1！Open R1开源复刻第三弹，下一步R1-Zero

Hugging Face的Open R1重磅升级，7B击败Claude 3.7 Sonnet等一众前沿模型。凭借CodeForces-CoTs数据集的10万高质量样本、IOI难题的严苛测试，以及模拟真实竞赛的提交策略优化，这款模型展现了惊艳的性能。

来自主题: AI资讯

10110 点击 2025-03-12 18:35

上一页当前第11页,共20页下一页