AI资讯新闻榜单内容搜索-DeepSeek

老外傻眼！明用英文提问，DeepSeek依然坚持中文思考

就在前天，DeepSeek 一口气上新了两个新模型，DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale。

来自主题: AI技术研报

8919 点击 2025-12-04 11:37

AI三国杀！OpenAI狂卷，DeepSeek封神，却被Mistral偷了家？

中美正忙着堆算力打AI战，欧洲却突然杀出一条血路：模型落地更重要！Mistral一口气扔出Large 3和Ministral 3，全开源、能看图、能跑在大多数电子设备上，甚至断网也能用。未来，AI是巨头的专属权力，还是人人都能握在手中的智能？这一次，欧洲给出了自己的答案。

来自主题: AI资讯

6803 点击 2025-12-04 09:50

DeepSeek-V3.2被找出bug了：疯狂消耗token，答案还可能出错，研究人员：GRPO老问题没解决

DeepSeek-V3.2很强很火爆，但随着讨论的深入，还是有bug被发现了。并且是个老问题：浪费token。不少网友都提到，DeepSeek-V3.2的长思考增强版Speciale，确确实实以开源之姿又给闭源TOP们上了压力，但问题也很明显：

来自主题: AI资讯

8848 点击 2025-12-04 09:49

DeepSeekV3.2技术报告还是老外看得细

ChatGPT三岁生日这一天，硅谷热议的新模型来自DeepSeek。

来自主题: AI资讯

6347 点击 2025-12-03 12:11

迎接「万物皆可RAG」时代：最新综述展示50多种多模态组合的巨大待探索空间

大模型最广泛的应用如 ChatGPT、Deepseek、千问、豆包、Gemini 等通常会连接互联网进行检索增强生成（RAG）来产生用户问题的答案。随着多模态大模型（MLLMs）的崛起，大模型的主流技术之一 RAG 迅速向多模态发展，形成多模态检索增强生成（MM-RAG）这个新兴领域。ChatGPT、千问、豆包、Gemini 都开始允许用户提供文字、图片等多种模态的输入。

来自主题: AI技术研报

7576 点击 2025-12-03 09:54

刚刚，「欧洲的DeepSeek」发布Mistral 3系列模型，全线回归Apache 2.0

刚刚，「欧洲的 DeepSeek」Mistral AI 刚刚发布了新一代的开放模型 Mistral 3 系列模型。该系列有多个模型，具体包括：「世界上最好的小型模型」：Ministral 3（14B、8B、3B），每个模型都发布了基础版、指令微调版和推理版。

来自主题: AI资讯

9198 点击 2025-12-03 08:26

DeepSeek-V3.2｜技术报告解读

这是一篇报告解读，原文是《DeepSeek-V3.2: Pushing the Frontier of Open Large Language Models》

来自主题: AI技术研报

9891 点击 2025-12-02 10:46

DeepSeek-V3.2系列开源，性能直接对标Gemini-3.0-Pro

突袭！ChatGPT发布三周年，DeepSeek嚯一下发出两个模型：DeepSeek-V3.2和DeepSeek-V3.2-Speciale。前者聚焦平衡实用，适用于日常问答、通用Agent任务、真实应用场景下的工具调用。

来自主题: AI资讯

10292 点击 2025-12-01 21:21

Z Potentials｜独家专访美国DeepSeek背后的90后投资人，他眼中的下一代万亿美元公司在哪里？

在本次 Z Potential 独家专访中，我们邀请到了 Striker Venture Partners 合伙人、Skild AI 与 Reflection AI 的早期投资人 Brian Zhan，深度解析他在 AI 时代如何快速投出明星级别的独角兽公司。

来自主题: AI资讯

8815 点击 2025-11-30 11:49

NeurIPS 2025 | DynaAct：DeepSeek R1之外，探索大模型推理的另一条道路

大模型推理的爆发，实际源于 scaling 范式的转变：从 train-time scaling 到 test-time scaling（TTS），即将更多的算力消耗部署在 inference 阶段。典型的实现是以 DeepSeek r1 为代表的 long CoT 方法：通过增加思维链的长度来获得答案精度的提升。那么 long CoT 是 TTS 的唯一实现吗？

来自主题: AI技术研报

9137 点击 2025-11-30 09:30