AI资讯新闻榜单内容搜索-压缩

清华新框架让大模型学会「精读略读」！实现12倍端到端加速，基准评分翻倍

来自清华大学、鹏城实验室与阿里巴巴未来生活实验室的联合研究团队发现：现有任务相关的压缩方法不仅陷入效率瓶颈——要么一次性加载全文（效率低），要么自回归逐步压缩（速度慢），更难以兼顾“保留关键信息”与“保持自然语言可解释性”。

来自主题: AI技术研报

10134 点击 2026-02-15 21:25

关于多模态大模型Token压缩技术进展，看这一篇就够了

近年来多模态大模型在视觉感知，长视频问答等方面涌现出了强劲的性能，但是这种跨模态融合也带来了巨大的计算成本。高分辨率图像和长视频会产生成千上万个视觉 token ，带来极高的显存占用和延迟，限制了模型的可扩展性和本地部署。

来自主题: AI技术研报

9953 点击 2026-01-26 14:22

别把整个 GitHub 装进 Skills，Skills 的正确用法

这篇《Skills 的最正确用法，是将整个 Github 压缩成你自己的超级技能库》绝对是一篇绝佳的入门指南，但也要注意：这种用法，还当不起“最”正确用法。我不是来抬杠的，而是想聊聊：怎么更好地使用

来自主题: AI技术研报

9083 点击 2026-01-25 11:59

LeCun、谢赛宁团队重磅论文：RAE能大规模文生图了，且比VAE更好

编辑｜Panda 在文生图模型的技术版图中，VAE 几乎已经成为共识。从 Stable Diffusion 到 FLUX，再到一系列扩散 Transformer，主流路线高度一致：先用 VAE 压缩视

来自主题: AI技术研报

7991 点击 2026-01-24 10:52

Skills的最正确用法，是将整个Github压缩成你自己的超级技能库。

昨天写了一篇关于在扣子上使用Skills的文章。

来自主题: AI产品测评

11627 点击 2026-01-21 17:26

腾讯AngelSlim升级，首个集LLM、VLM及语音多模态为一体的投机采样训练框架，推理速度飙升1.8倍

随着大模型步入规模化应用深水区，日益高昂的推理成本与延迟已成为掣肘产业落地的核心瓶颈。在 “降本增效” 的行业共识下，从量化、剪枝到模型蒸馏，各类压缩技术竞相涌现，但往往难以兼顾性能损耗与通用性。

来自主题: AI技术研报

10850 点击 2026-01-19 08:54

不得了，这个新技术把视频压缩到了0.02%！

感谢AI！

来自主题: AI技术研报

7698 点击 2026-01-15 10:35

让Agent记住一切是愚蠢的：SimpleMem用「结构化语义压缩」登顶记忆SOTA

如果人类的大脑像现在的LLM Agent一样工作，记住每一句今天明天的废话，我们在五岁时就会因为内存溢出而宕机。真正的智能，核心不在于“存储”，而在于高效的“遗忘”与“重组”。

来自主题: AI技术研报

9477 点击 2026-01-15 09:22

不用额外缓存！英伟达开源大模型记忆压缩方案，128K上下文提速2.7倍

提高大模型记忆这块儿，美国大模型开源王者——英伟达也出招了。

来自主题: AI技术研报

9258 点击 2026-01-14 15:29

DeepSeek-OCR是「长文本理解」未来方向？中科院新基准VTCBench给出答案

近期，DeepSeek-OCR 凭借其创新的「视觉文本压缩」（Vision-Text Compression, VTC）范式引发了技术圈的高度关注。为了解答这一疑问，来自中科院自动化所、中国科学院香港创新研究院等机构的研究团队推出了首个专门针对视觉 - 文本压缩范式的基准测试 ——VTCBench。

来自主题: AI技术研报

8117 点击 2026-01-11 10:01