AI资讯新闻榜单内容搜索-Deep

谷歌的Gemma-4-31B适合哪些人？值得你放弃Qwen3.5-27B吗？深度调研战略报告

Gemma4 31B的发布，在开源模型社区引发了巨大的关注。面对这款由谷歌DeepMind于2026年4月2日推出的重磅模型，很多技术团队和本地部署玩家都在问同一个问题：Gemma4的出现，到底是在开辟一条新的本地部署路线，还是只是给高端玩家多了一个可选项？我们到底需不需要把现有的Qwen3.5 27B工作流整体迁移过去？

来自主题: AI技术研报

9467 点击 2026-04-08 16:29

北大团队改造DeepSeek注意力，速度快四倍还不丢精度

就在大家都急头白脸地等待DeepSeek-V4的时候，冷不丁一篇新论文引起了网友们的注意—— 提出新稀疏注意力机制HISA（分层索引稀疏注意力），突破64K上下文的索引瓶颈，相比DeepSeek正在用的DSA（DeepSeek Sparse Attention）提速2-4倍。

来自主题: AI技术研报

7668 点击 2026-04-07 10:30

科技史上最贵的饭局：扎克伯格痛失DeepMind始末

最近，著名记者、作家塞巴斯蒂安・马拉比出了本新书，名叫《无限机器：德米斯・哈萨比斯、DeepMind 与超级智能的探索》。

来自主题: AI资讯

8655 点击 2026-04-05 20:00

NVIDIA GTC上登顶的DeepResearch Bench，到底在评什么？

3 月 16 日，在刚刚结束的 NVIDIA GTC 2026 大会上，黄仁勋在长达三小时的 Keynote 演讲中发布了 NVIDIA Agent Toolkit 和 AI-Q 开放智能体蓝图，将 AI Agent 定位为下一个重大前沿。

来自主题: AI技术研报

9096 点击 2026-04-01 09:39

DeepMind之父惊人自白：我造的AI可能灭绝人类，但已无人能停下

从拦截彼得·蒂尔、警告马斯克，到如今公开说「必须有适应能力」，哈萨比斯史诗级转身：AI安全窗口正在永久关闭，他不再幻想制度，而是赌上全部身家——赌影响力，赌良知，赌自己。

来自主题: AI资讯

7799 点击 2026-03-31 14:41

搞懂“记忆”必看｜吃透Engram，坐等Deepseek新模型

第一篇论文来自字节SEED团队，打了一些基础；《Over-Tokenized Transformer》。论文标题看上去在讨论“过度分词”。而重点必然是在第二篇上—— DeepSeek公司的学术成果Engram。《Conditional Memory via Scalable Lookup》也就是Engram模块所出处的论文。

来自主题: AI技术研报

10404 点击 2026-03-31 10:30