AI资讯新闻榜单内容搜索-DeepSeeK

真·用DeepSeek做生意！在沙漠造雪场，给详细BP那种丨阿里国际站首个产业级应用

我想在沙漠里建一个室内滑雪场。DeepSeek：可以，详细计划如下。这是阿里国际站首个AI搜索引擎Accio接入DeepSeek之后的演示首秀。即便是这么离谱的想法，它还是在短短30秒内搜索了大量资料、反复推理，给出了一份有理有据的商业计划。

来自主题: AI资讯

10595 点击 2025-03-02 20:59

DeepSeek关键RL算法GRPO，有人从头跑通了，贡献完整代码

GRPO（Group Relative Policy Optimization）是 DeepSeek-R1 成功的基础技术之一，我们之前也多次报道过该技术，比如《DeepSeek 用的 GRPO 占用大量内存？有人给出了些破解方法》。

来自主题: AI技术研报

10332 点击 2025-03-02 15:14

DeepSeek R1也会大脑过载？过度思考后性能下降，少琢磨让计算成本直降43％

原来，大型推理模型（Large Reasoning Model，LRM）像人一样，在「用脑过度」也会崩溃，进而行动能力下降。

来自主题: AI技术研报

8632 点击 2025-03-02 14:04

周末吃瓜！硅基流动和潞晨科技两家创始人公开互怼：你长期黑我，你抄袭

大概从三四个小时前开始，两家大模型公司潞晨科技创始人尤洋和硅基流动创始人袁进辉，在社交平台公开互怼。先是尤洋在知乎对袁进辉发难，发文《坑人的硅基流动》，尤洋称本来不想发这些东西，但是硅基流动的袁进辉老师频繁在朋友圈里阴阳他。"这家公司疑似组织水军在网上长期黑我。今天DeepSeek有一篇文章指向我，他也在那里煽风点火。"

来自主题: AI资讯

10102 点击 2025-03-02 09:44

周末AI大瓜，围绕DeepSeek大消息不断！潞晨科技尤洋发文致歉

3月1日，潞晨科技官微发布了两则消息。先是宣布：“尊敬的用户，潞晨云将在一周后停止提供DeepSeek API服务，请尽快用完您的余额。如果没用完，我们全额退款。”后又发布消息：“感谢网友的热心提醒，Colossal-AI此前发布对DeepSeek-R1（671B）模型的LoRA微调，在参数加载过程中因参数名称不匹配的Bug导致Loss异常，已在GitHub线上修复。”

来自主题: AI资讯

10697 点击 2025-03-02 09:34

刚刚，DeepSeek全面开源V3/R1推理系统！成本利润率高达545%

DeepSeek公开推理系统架构，成本利润率可达545%！明天还有更大惊喜吗？

来自主题: AI资讯

7676 点击 2025-03-01 22:47

DeepSeek效应初现：Grok-3补刀ChatGPT，OpenAI已在ICU?

DeepSeek和xAI相继用R1和Grok-3证明：预训练Scaling Law不是OpenAI的护城河。将来95%的算力将用在推理，而不是现在的训练和推理各50%。OpenAI前途不明，生死难料！

来自主题: AI资讯

8148 点击 2025-03-01 22:37

AI 合同大模型，正式进入"脑力革命"时代

2025年开年，全球AI战场硝烟弥漫。 ChatGPT悄然迭代至GPT-6，在DeepSeek横空出世、在多领域大展拳脚后，马斯克旗下的人工智能公司紧随其后重磅发布了Grok 3系列模型。

来自主题: AI资讯

8288 点击 2025-03-01 22:28

「烁乐信息」旗下医学大模型Med-Go接入DeepSeek，病历诊断准确率提升10%｜早期项目

DeepSeek“爆火”后，各家医疗企业争相部署似乎已成为春节复工以来的头等大事。据36氪不完全统计，节后复工以来，至少20家以上医疗领域企业公开宣布正在引入DeepSeek。其中虽不乏恒瑞医药、云南白药等传统药企；金域医学、圣湘生物等老牌IVD企业，但表现更活跃的各路AI医疗概念公司，如智云健康、鹰瞳科技、医渡科技、树坤科技等。

来自主题: AI资讯

8244 点击 2025-03-01 22:19

探索跳跃式思维链：DeepSeek创造力垫底，Qwen系列接近人类顶尖水平

在大语言模型 (LLM) 的研究中，与以 Chain-of-Thought 为代表的逻辑思维能力相比，LLM 中同等重要的 Leap-of-Thought 能力，也称为创造力，目前的讨论和分析仍然较少。这可能会严重阻碍 LLM 在创造力上的发展。造成这种困局的一个主要原因是，面对「创造力」，我们很难构建一个合适且自动化的评估流程。

来自主题: AI技术研报

8154 点击 2025-03-01 22:13