AI资讯新闻榜单内容搜索-DeepSeek-R

NP难问题接近被AI破解！南航牛津爆改DeepSeek-R1推理，碾压人类27年研究

给DeepSeek-R1推理指导，它的数学推理能力就开始暴涨。更令人吃惊是，Qwen2.5-14B居然给出了此前从未见过的希尔伯特问题的反例！而人类为此耗费了27年。研究者预言：LLM离破解NP-hard问题，已经又近了一步。

来自主题: AI技术研报

9490 点击 2025-03-04 16:20

DeepSeek-R1、o1都在及格线挣扎！字节开源全新知识推理测评集，覆盖285个学科

要知道，过去几年，各种通用评测逐渐同质化，越来越难以评估模型真实能力。GPQA、MMLU-pro、MMLU等流行基准，各家模型出街时人手一份，但局限性也开始暴露，比如覆盖范围狭窄（通常不足 50 个学科），不含长尾知识；缺乏足够挑战性和区分度，比如 GPT-4o 在 MMLU-Pro 上准确率飙到 92.3%。

来自主题: AI技术研报

7195 点击 2025-03-04 14:28

天翼云CPU实例部署DeepSeek-R1模型最佳实践

本文介绍了英特尔®至强®处理器在AI推理领域的优势，如何使用一键部署的镜像进行纯CPU环境下基于AMX加速后的DeepSeek-R1 7B蒸馏模型推理，以及纯CPU环境下部署DeepSeek-R1 671B满血版模型实践。

来自主题: AI技术研报

8559 点击 2025-03-04 10:23

刚刚，元宝超DeepSeek拿下第一，腾讯的饱和式攻击奏效了！

智东西3月3日报道，继2月22日超过豆包后，今日，腾讯旗下AI大模型应用腾讯元宝超过DeepSeek，登顶iOS免费App榜。近期借势DeepSeek，腾讯元宝存在感爆棚，密集上新：2月17日宣布已上线DeepSeek-R1 671B和腾讯混元深度思考模型Thinker（T1）；2月18日宣布调用腾讯元宝紧急支持微信搜索，让大家都能稳定体验和使用DeepSeek-R1；

来自主题: AI资讯

7529 点击 2025-03-03 23:07

DeepSeek关键RL算法GRPO，有人从头跑通了，贡献完整代码

GRPO（Group Relative Policy Optimization）是 DeepSeek-R1 成功的基础技术之一，我们之前也多次报道过该技术，比如《DeepSeek 用的 GRPO 占用大量内存？有人给出了些破解方法》。

来自主题: AI技术研报

9462 点击 2025-03-02 15:14

周末AI大瓜，围绕DeepSeek大消息不断！潞晨科技尤洋发文致歉

3月1日，潞晨科技官微发布了两则消息。先是宣布：“尊敬的用户，潞晨云将在一周后停止提供DeepSeek API服务，请尽快用完您的余额。如果没用完，我们全额退款。”后又发布消息：“感谢网友的热心提醒，Colossal-AI此前发布对DeepSeek-R1（671B）模型的LoRA微调，在参数加载过程中因参数名称不匹配的Bug导致Loss异常，已在GitHub线上修复。”

来自主题: AI资讯

9543 点击 2025-03-02 09:34