AI资讯新闻榜单内容搜索-Deep

华为+DeepSeek，推理性能创新高！技术报告也公布出来了

部署超大规模MoE这件事，国产芯片的推理性能，已经再创新高了—— 不仅是“英伟达含量为0”这么简单，更是性能全面超越英伟达Hopper架构！

来自主题: AI技术研报

11218 点击 2025-05-19 16:37

中国 AI 大厂，被 Deepseek 掀了牌桌之后

当技术范式重构，强者也不得不重新起跑。

来自主题: AI资讯

8115 点击 2025-05-19 14:58

换模型就得重新优化提示词？用下MetaSPO，专门优化系统提示的Meta-Learning框架 | 最新

每次更换语言模型就要重新优化提示词？资源浪费且效率低下！本文介绍MetaSPO框架，首个专注模型迁移系统提示优化的元学习方法，让一次优化的提示可跨模型通用。我在儿童教育场景的实验验证了效果：框架自动生成了五种不同教育范式的系统提示，最优的"苏格拉底式"提示成功由DeepSeek-V3迁移到通义千问模型，评分从0.3920提升至0.4362。

来自主题: AI技术研报

8924 点击 2025-05-19 10:11

被低估的ChatGPT新功能，10分钟搞定DeepSeek代码库深度研究

ChatGPT悄悄上线的直连Github新功能太强大！一旦连上Github，立马化身「研究怪兽」：不管是DeepSeek这样的明星开源项目，还是自己DIY的文档资料，只要放进仓库，就能交给深度研究，一键生成专业到飞起的报告。

来自主题: AI产品测评

11216 点击 2025-05-18 15:05

AI怎样模仿人类大脑的注意力机制？

最近，人们对AI谈得最多的是deepseek（简称DS）。这匹来自中国本土的黑马，闯入全球视野，一度扰乱美国股市，在 AI 领域掀起了一场轩然大波。

来自主题: AI技术研报

10713 点击 2025-05-17 18:15

梁文锋署名DeepSeek新论文：公开V3大模型降本方法

梁文锋亲自参与的DeepSeek最新论文，来了！

来自主题: AI技术研报

9108 点击 2025-05-16 11:47

个人开发者训400亿参数大模型：分布式算力，DeepSeek架构，3090单卡部署

打破科技巨头算力垄断，个人开发者联手也能训练超大规模AI模型？

来自主题: AI资讯

9700 点击 2025-05-16 11:10

「边思考、边搜索、边写作」WebThinker开启AI搜索&研究新纪元！

大型推理模型（如 OpenAI-o1、DeepSeek-R1）展现了强大的推理能力，但其静态知识限制了在复杂知识密集型任务及全面报告生成中的表现。为应对此挑战，深度研究智能体 WebThinker 赋予 LRM 在推理中自主搜索网络、导航网页及撰写报告的能力。

来自主题: AI技术研报

8707 点击 2025-05-16 11:04

全球头部AI应用公司，现状如何？

随着DeepSeek的横空出世，行业竞争加剧，无论是AI原生企业还是转型中的互联网巨头，都面临战略路径的重新校准。这一现象引发了行业的连锁反应：一方面，头部企业加速产品迭代和推广；另一方面，部分企业由于战略失误和反应缓慢开始面临用户流失风险。在这样的竞争环境下，企业的战略选择显得尤为关键。成功的AI公司通常具备三大核心能力：精准的战略定位、快速的调整能力以及高效的执行落地。

来自主题: AI技术研报

11505 点击 2025-05-16 10:06

超越OpenAI、ElevenLabs，MiniMax新一代语音模型屠榜！人格化语音时代来了

国产大模型进步的速度早已大大超出了人们的预期。年初 DeepSeek-R1 爆火，以超低的成本实现了部分超越 OpenAI o1 的表现，一定程度上让人不再过度「迷信」国外大模型。

来自主题: AI技术研报

11243 点击 2025-05-16 09:59