AI资讯新闻榜单内容搜索-deepseek

搞懂“记忆”必看｜吃透Engram，坐等Deepseek新模型

第一篇论文来自字节SEED团队，打了一些基础；《Over-Tokenized Transformer》。论文标题看上去在讨论“过度分词”。而重点必然是在第二篇上—— DeepSeek公司的学术成果Engram。《Conditional Memory via Scalable Lookup》也就是Engram模块所出处的论文。

来自主题: AI技术研报

10387 点击 2026-03-31 10:30

早于DeepSeek Engram！用「查表」重置Transformer记忆 | ICLR

ICLR论文STEM架构率先提出「查表式记忆」架构，早于DeepSeek Engram三个月。它将Transformer的FFN从动态计算改为静态查表，用token索引的embedding表直接读取记忆，彻底解耦记忆容量与计算开销。

来自主题: AI技术研报

8684 点击 2026-03-31 10:04

这个「反人类」AI插件，专门让你体验DeepSeek宕机的感觉｜附安装地址

官方宣传语：你是否隐隐担忧，自己或身边的人正在：参与一场席卷所有人的技能大退化？遭受 LLM 诱发的？一个名为 Sam Lavigne 的大学教授，最近发布并开源了一款名为「Slow LLM」的 AI 工具。

来自主题: AI资讯

8040 点击 2026-03-30 23:55

DeepSeek网页版大升级！随后宕机11小时崩上热搜，新模型真的来了

DeepSeek崩上热搜！宕机持续超过8小时，写论文的、角色扮演的和心情不好找AI吐槽的人也都崩溃了。But！这不是一次普通的服务中断，反而被解读为模型升级的前兆。

来自主题: AI资讯

8319 点击 2026-03-30 10:58

DeepSeek 崩溃超12小时，工程师连夜抢修，现已恢复正常

从3月29日晚21时左右起，国内大模型产品DeepSeek的网页端与APP端服务器持续处于崩溃状态，大量用户反馈无法正常访问对话服务。

来自主题: AI资讯

8197 点击 2026-03-30 09:41

aiX-apply-4B逆袭DeepSeek-V3.2！aiXcoder发布代码变更应用模型，单卡推理提效15倍

硅心科技（aiXcoder）发布了一款专为「代码变更应用」场景设计的高性能、轻量级模型 aiX-apply-4B。基准测试结果显示，在 20 多种主流编程语言及 Markdown 等多类型文件格式的测试中，aiX-apply-4B 的平均准确率达到 93.8%，超越 Qwen3-4B 基座模型 62.6% 的准确度

来自主题: AI技术研报

9103 点击 2026-03-27 18:21