AI资讯新闻榜单内容搜索-不

刚刚，DeepSeek开始频繁更新：Tile Kernels、DeepEP V2

就在刚刚，DeepSeek 的 GitHub 开始了频繁更新，上线开源了一个新的代码库 Tile Kernels，同时并对 DeepEP 代码库进行了更新，上线了 DeepEP V2。距离上次 DeepSeek 悄悄更新 Mega MoE、FP4 Indexer 还不到一周。

来自主题: AI资讯

9511 点击 2026-04-24 10:09

强如谷歌，算力也不够了。

来自主题: AI资讯

7909 点击 2026-04-24 09:42

几乎所有 Transformer 都在做一件反常的事：把大量注意力集中到少数几个特定 Token 上。这不是 bug，而是 Transformer 固有的「注意力汇聚」（Attention Sink）。首篇系统性综述，带你从利用、理解到消除，全面掌握这一核心现象。

来自主题: AI技术研报

9405 点击 2026-04-24 09:14

五周前老黄亲自站台封神的OpenClaw，现在连自家大厂都不敢装最新版。疯狂迭代、系统频崩、下载腰斩，甚至连「一键跑路」代码都被端了上来。

来自主题: AI资讯

7032 点击 2026-04-24 09:14

刚刚，混元的 Hy3 Preview 也正式亮相，这是腾讯首席 AI 科学家姚顺雨主导的一个模型。姚顺雨表示，Hy3 preview是混元大模型重建的第一步。他希望通过这次开源和发布，不断提升 Hy3 正式版的实用性，以及模型在真实场景中的综合表现，并开始探索特色模型能力。

来自主题: AI资讯

9070 点击 2026-04-23 17:21

一位接近DeepSeek的一线机构投资人士告诉我们，这些数字都不准确，DeepSeek融前估值是3000亿人民币，约合440亿美元。这一估值超过当前已经上市的大模型公司Minimax的2400亿（4月23日），接近智谱的3800亿元。

来自主题: AI资讯

9480 点击 2026-04-23 17:09

让AI理解人的想法，而不是让人适应AI。

来自主题: AI资讯

10812 点击 2026-04-23 15:20

成立不到一年，跻身“百亿估值俱乐部”。

来自主题: AI资讯

15367 点击 2026-04-23 15:15

最近，苹果又整了个活儿，很工程、也挺关键：把又贵又强的 Transformer，改造成又便宜又差不多强的 Mamba。而且，性能基本没怎么掉。

来自主题: AI技术研报

9217 点击 2026-04-23 14:46

浙江大学团队开源了一个基于多智能体技术的演化叙事系统OpenStory，不仅还原了经典《红楼梦》中的角色和场景，实验结果也揭示了AGI下系统脆弱性，引发对智能演化的深刻思考。

来自主题: AI资讯

10909 点击 2026-04-23 14:44