AI资讯新闻榜单内容搜索-TEN

在长文本上比Flash Attention快10倍！清华等提出APB序列并行推理框架

在 ChatGPT 爆火两年多的时间里，大语言模型的上下文窗口长度基准线被拉升，以此为基础所构建的长 CoT 推理、多 Agent 协作等类型的高级应用也逐渐增多。

来自主题: AI技术研报

7515 点击 2025-03-12 14:53

DeepSeek的MLA，任意大模型都能轻松迁移了

DeepSeek-R1 作为 AI 产业颠覆式创新的代表轰动了业界，特别是其训练与推理成本仅为同等性能大模型的数十分之一。多头潜在注意力网络（Multi-head Latent Attention, MLA）是其经济推理架构的核心之一，通过对键值缓存进行低秩压缩，显著降低推理成本 [1]。

来自主题: AI技术研报

5329 点击 2025-03-07 10:24

“Transformer就像燃油车，attention-free才是新能源” | 对话RWKV创始人彭博

当DeepSeek引发业界震动时，元始智能创始人彭博正专注于一个更宏大的愿景。

来自主题: AI资讯

7731 点击 2025-02-27 11:02

YOLO已经悄悄来到v12，首个以Attention为核心的YOLO框架问世

YOLO 系列模型的结构创新一直围绕 CNN 展开，而让 transformer 具有统治优势的 attention 机制一直不是 YOLO 系列网络结构改进的重点。这主要的原因是 attention 机制的速度无法满足 YOLO 实时性的要求。

来自主题: AI技术研报

8574 点击 2025-02-22 14:14

废话检测器，一次失败的AI尝试

该篇文章为：100% HWC（Human-Written Content）100% 人类创作内容。（没有任何人工智能生成的内容）自从开始了 Easier Life 这个项目后，我每天都有很多新奇的想法。说好每两周要做一个产品，没想到第二个就“失败”了。

来自主题: AI资讯

7982 点击 2025-02-20 10:24

图像生成推理大模型，港中文北大等联手破解画质提升难题

图像生成模型，也用上思维链（CoT）了！此外，作者还提出了两种专门针对该任务的新型奖励模型——潜力评估奖励模型。（Potential Assessment Reward Model，PARM）及其增强版本PARM++。

来自主题: AI技术研报

5370 点击 2025-02-10 11:09

高效Attention引擎是怎样炼成的？陈天奇团队FlashInfer打响新年第一枪！

新年第一天，陈天奇团队的FlashInfer论文出炉！块稀疏、可组合、可定制、负载均衡......更快的LLM推理技术细节全公开。

来自主题: AI技术研报

6847 点击 2025-01-24 13:58

独家｜ZP独家合作AI独角兽Perplexity，开学季减压神器，最适合学生的AI搜索引擎！

新学期压力山大？让AI来帮你轻松应对！Z Potentials独家合作AI搜索独角兽Perplexity为学生们推荐一款学习神器——Perplexity Spaces！这个AI学习助手将彻底改变你的学习方式。

来自主题: AI资讯

8461 点击 2025-01-14 15:17

4比特量化三倍加速不掉点！清华即插即用的SageAttention迎来升级

大模型中，线性层的低比特量化已经逐步落地。然而，对于注意力模块，目前几乎各个模型都还在用高精度（例如 FP16 或 FP32）的注意力运算进行训练和推理。并且，随着大型模型需要处理的序列长度不断增加，Attention（注意力运算）的时间开销逐渐成为主要开销。

来自主题: AI技术研报

7244 点击 2024-12-27 09:44

突破数据瓶颈！交大研发电脑智能体，让 AI 替你熬夜做 PPT

想象这样一个场景：深夜 11 点，你已经忙碌了一天，正准备休息，却想起明天早上还得分享一篇经典论文《Attention Is All You Need》，需要准备幻灯片。这时，你突然想到了自己的 AI 助手 —— PC Agent。

来自主题: AI技术研报

9606 点击 2024-12-25 11:04

AI资讯新闻榜单内容搜索-TEN

在长文本上比Flash Attention快10倍！清华等提出APB序列并行推理框架

DeepSeek的MLA，任意大模型都能轻松迁移了

“Transformer就像燃油车，attention-free才是新能源” | 对话RWKV创始人彭博

YOLO已经悄悄来到v12，首个以Attention为核心的YOLO框架问世

废话检测器，一次失败的AI尝试

图像生成推理大模型，港中文北大等联手破解画质提升难题

高效Attention引擎是怎样炼成的？陈天奇团队FlashInfer打响新年第一枪！

独家｜ZP独家合作AI独角兽Perplexity，开学季减压神器， 最适合学生的AI搜索引擎！

4比特量化三倍加速不掉点！清华即插即用的SageAttention迎来升级

突破数据瓶颈！交大研发电脑智能体，让 AI 替你熬夜做 PPT

独家｜ZP独家合作AI独角兽Perplexity，开学季减压神器，最适合学生的AI搜索引擎！