AI资讯新闻榜单内容搜索-张量

超越MLA！新架构MLRA百万token，解码最高2.8倍速 | ICLR'26

MLRA通过拆分KV缓存为四个并行分支，显著降低显存占用并实现4路张量并行。推理速度比MLA最高快2.8倍，支持百万级上下文，且模型质量更优。无需牺牲性能，即可高效扩展长文本处理能力。

来自主题: AI技术研报

10369 点击 2026-03-19 15:25

以「图」破局，HyperOffload定义超节点存储管理新范式

随着生成式 AI 迈入万亿参数时代，大语言模型（LLM）的推理与部署面临着前所未有的“显存墙”挑战。如何在超节点（SuperNode）复杂的异构存储架构下，实现海量张量的高效管理和调度，已成为大模型落地的胜负手。

来自主题: AI技术研报

10062 点击 2026-03-18 09:30

开源项目VibeTensor连论文都是AI写的，陈天奇、贾扬清点赞：Vibe Coding版PyTorch

刚刚，英伟达杰出工程师许冰（Bing Xu）在 GitHub 上开源了一个新项目 VibeTensor，让我们看到了 AI 在编程方面的强大实力。从名字也能看出来，这是 Vibe Coding 的成果。事实也确实如此，这位谷歌学术引用量超 20 万的工程师在 X 上表示：「这是第一个完全由 AI 智能体生成的深度学习系统，没有一行人类编写的代码。」

来自主题: AI资讯

10994 点击 2026-01-24 11:12

刚刚，英伟达CUDA迎来史上最大更新！

几个小时前，NVIDIA CUDA Toolkit 13.1 正式发布，英伟达官方表示：「这是 20 年来最大的一次更新。」CUDA Tile 是 NVIDIA CUDA Toolkit 13.1 最核心的更新。它是一种基于 tile 的编程模型，能够以更高的层次编写算法，并抽象化专用硬件（例如张量核心）的细节。

来自主题: AI资讯

9388 点击 2025-12-06 21:48

神经网络与符号系统大一统！华盛顿大学教授把AI逻辑统一成了张量表示

在通往AGI的道路上，人类欠缺的是一种合适的编程语言？华盛顿大学计算机学院教授Pedro Domingos在最新的独作论文中表示，当前AI领域使用的编程语言，无一例外全都存在缺陷。同时，Domingos还提出了一种新的统一语言，将AI逻辑统一成了张量表示。

来自主题: AI技术研报

8298 点击 2025-10-17 15:43

通用LLM压缩算法，居然藏视频编码里！2.5bit实现4bit性能，硬件无缝支持

LLM.265研究发现，视频编码器本身就是一种高效的大模型张量编码器。原本用于播放8K视频的现成视频编解码硬件，其实压缩AI模型数据的效率也非常高，甚至超过了许多专门为AI开发的方案。该工作已被世界微架构大会MICRO-2025正式接收，相关成果将于今年10月在首尔进行展示与讨论。

来自主题: AI技术研报

8403 点击 2025-09-05 10:14

实测DeepSeek V3.1，不止拓展上下文长度

DeepSeek V3.1和V3相比，到底有什么不同？官方说的模模糊糊，就提到了上下文长度拓展至128K和支持多种张量格式，但别急，我们已经上手实测，为你奉上更多新鲜信息。

来自主题: AI产品测评

11339 点击 2025-08-21 10:49

OpenAI久违发了篇「正经」论文：线性布局实现高效张量计算

OpenAI 发论文的频率是越来越低了，如果你看到了一份来自 OpenAI 的新 PDF 文件，那多半也是新模型的系统卡或相关增补文件或基准测试，很少有新的研究论文。

来自主题: AI资讯

8550 点击 2025-06-05 14:33

AI数学基础扫盲

AI中的应用：在机器学习中，单条数据样本的表征都是以向量化的形式来完成的。向量化的方式可以帮助AI算法在迭代与计算过程中，以更高效的方式完成。

来自主题: AI技术研报

10515 点击 2024-03-10 10:37

这一代AI追随者的窘境

前不久，原阿里首席AI科学家贾扬清的一条朋友圈截图四处流传。贾扬清说，他的一个朋友告诉他，某国产大模型不过是LLaMA架构，只是更换了几个变量名而已。很快有好事者发现，在大模型、数据集开源社区Hugging Face上，就有一位开发者发出了类似质疑：“该模型使用了Meta LLaMA 的架构，只修改个tensor（张量）”。

来自主题: AI资讯

8982 点击 2023-11-26 20:58