AI资讯新闻榜单内容搜索-Deep

DeepSeek陈德里AI论文第二弹：从6分到8分，DeliAutoResearch SKILL又进化了

DeepSeek 研究员陈德里（Deli Chen）和 AI 合作的第二篇论文来了！论文地址：https://victorchen96.github.io/continual_learning_survey.pdf这篇论文聚焦 continual learning（持续学习）与 self-iteration（自我迭代）。在陈德里看来，这是 AI 迈向 AGI 过程中极为关键的一步。

来自主题: AI技术研报

10490 点击 2026-05-30 22:40

700亿融资赶紧到位吧，DeepSeek开始限制重生、修改次数了

5月29日下午，不少网友发现，DeepSeek重新生成、修改有次数限制了。连续修改或重新生成几次后，页面会提示达到上限。有网友反馈，在普通对话中，重新生成3到6次后就会达到上限；而在专家模式下，可能只有3次机会。修改输入次数上限一般是6次。

来自主题: AI资讯

9022 点击 2026-05-30 10:48

AI时代，产品经理涌向字节跳动

Google DeepMind研究院姚顺宇最近接受媒体人采访时说：做一个好的产品经理，是一个我现在想不明白该怎么训练AI去做的事。言外之意，AI时代产品经理很难被替代。招聘市场已经给出了答案。根据脉脉2026年1—4月的数据，热招岗位里大模型算法排第一，产品经理排第二，AI产品经理也排到了前五的位置。

来自主题: AI资讯

8712 点击 2026-05-30 00:21

消耗1830亿token，Meta用AI把数学教材翻译成了一个超大Lean库

编辑｜Panda 数学正在迎来 AI 革命。最近几个月尤为明显。比如，就在前几天，Google DeepMind 新论文宣布其最新系统 AlphaProof Nexus 在一次自主运行中，解决了 3

来自主题: AI资讯

9146 点击 2026-05-29 15:11

Claude Opus 4.8蒸馏国产大模型Qwen、DeepSeek，网友晒实锤！

网上有条帖子炸了，稳定复现，通过 API 问 Claude Opus 4.8 你是什么模型。回答是：Qwen，或者 DeepSeek。重要的事说三遍：必须是通过 API，必须是通过 API，必须是通过 API。因为网页端有系统提示词，会做二次处理。

来自主题: AI资讯

9628 点击 2026-05-29 13:04

DeepSeek V4芯模协同背后，国产算力生态开始飞轮加速

DeepSeek V4发布，比模型本身更受关注的，是一个根本性的转变：国产算力生态正在从过去“芯片被动适配模型”的单向奔赴，迈向“芯模协同”的新阶段。

来自主题: AI资讯

8794 点击 2026-05-29 09:39

多变量神经缩放定律迈向大一统：Mila联手DeepMind提出UNSL

过去的大模型 scaling law 通常回答的是：当模型参数量、数据量和训练计算量增加后，loss 会如何下降。

来自主题: AI技术研报

6816 点击 2026-05-29 09:19

刚刚，DeepSeek陈德里与两个AI，合写了一篇论文

「借助 CodeAgent，我终于可以重新捡起很多过去因为精力不足而搁置的事情了，写博客就是其中之一。这篇博客大概 1% 是我写的，99% 是 Agent 写的 😂」。

来自主题: AI技术研报

7058 点击 2026-05-29 09:19

首次！DeepSeek-V4-Pro全参数后训练，被第三方在国产卡上跑通

近期，深圳河套学院（SLAI）AI训练平台项目团队，联合哈尔滨工业大学（深圳）、深圳大数据研究院、华为GTS（全球技术服务）团队与深智城AI算力平台，仅用1个月，共同基于昇腾910C国产算力集群实现DeepSeek-V4-Pro全参数续训练/SFT稳定运行，完成长稳训练1500+步，训练MFU超30%，关键训练算子效率提升14%。

来自主题: AI技术研报

9509 点击 2026-05-28 14:56

全球首次单机降服万亿巨模DeepSeek-V4！RL后训练框架Orbit开源！

从数学、代码、复杂推理，到多轮工具调用，大模型的很多能力的提升都离不开 RL 后训练。但当模型规模进入 MoE 万亿参数级别之后，RL 不再只是一个算法问题，同时更加是一个系统问题。

来自主题: AI技术研报

7280 点击 2026-05-28 14:51