AI资讯新闻榜单内容搜索-DeepSeek-R

o3-mini数学推理暴打DeepSeek-R1？AIME 2025初赛曝数据集污染大瓜

就在刚刚，AIME 2025 I数学竞赛的大模型参赛结果出炉，o3-mini取得78%的最好成绩，DeepSeek R1拿到了65%，取得第四名。然而一位教授却发现，某些1.5B小模型竟也能拿到50%，莫非真的存在数据集污染？

来自主题: AI资讯

8235 点击 2025-02-10 11:21

DeepSeek 的最新模型 DeepSeek-V3 和 DeepSeek-R1 都属于 MoE（混合专家）架构，并在开源世界产生了较大的影响力。特别是 2025 年 1 月开源的 DeepSeek-R1，模型性能可挑战 OpenAI 闭源的 o1 模型。

来自主题: AI资讯

9610 点击 2025-02-09 22:14

黑科技来了！开源LLM微调神器Unsloth近期更新，将GRPO训练的内存使用减少了80%！只需7GB VRAM，本地就能体验AI「啊哈时刻」。

来自主题: AI资讯

8180 点击 2025-02-09 21:29

刚刚，腾讯云再放大招——不仅上线了 DeepSeek-R1 和 V3 原版模型的 API 接口，还将它们接入了大模型知识引擎，并支持联网搜索，成为国内率先实现这一能力的云厂商。

来自主题: AI资讯

7138 点击 2025-02-08 17:25

自 DeepSeek-R1 发布以来，群组相对策略优化（GRPO）因其有效性和易于训练而成为大型语言模型强化学习的热门话题。R1 论文展示了如何使用 GRPO 从遵循 LLM（DeepSeek-v3）的基本指令转变为推理模型（DeepSeek-R1）。

来自主题: AI技术研报

5791 点击 2025-02-07 16:53

一项非常鼓舞人心的发现是：DeepSeek-R1-Zero 通过纯强化学习（RL）实现了「顿悟」。在那个瞬间，模型学会了自我反思等涌现技能，帮助它进行上下文搜索，从而解决复杂的推理问题。

来自主题: AI技术研报

7824 点击 2025-02-07 15:51

有时，当某项技术变得更便宜时，反而会促使整体投入增加。我认为，从长期来看，人类对智能和算力的需求几乎没有上限，因此我仍然看好AI计算需求的持续增长。我认为DeepSeek-R1在地缘政治上的影响尚有待厘清，同时它也为AI应用开发者带来了巨大机遇。

来自主题: AI资讯

6666 点击 2025-02-07 12:19

成本不到150元，训练出一个媲美DeepSeek-R1和OpenAI o1的推理模型？！这不是洋葱新闻，而是AI教母李飞飞、斯坦福大学、华盛顿大学、艾伦人工智能实验室等携手推出的最新杰作：s1。

来自主题: AI资讯

7922 点击 2025-02-07 00:26

DeepSeek-R1因其游刃有余的用户需求响应能力，尤其是其独特的“深度思考（DeepThink）”模式及卓越的推理能力，在这个春天绝响全球。为了让更多领域的用户切实便捷地开展体验，超算互联网平台第一时间上线了DeepSeek Chatbot可视化界面功能。

来自主题: AI资讯

9772 点击 2025-02-05 14:05

DeepSeek-R1 系列模型的开源，因其出色的性能和低廉的开发成本，已引发全球的热切讨论和关注。

来自主题: AI资讯

6768 点击 2025-02-05 12:16