AI资讯新闻榜单内容搜索-长上下文

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 长上下文

Bengio等人新作：注意力可被视为RNN，新模型媲美Transformer，但超级省内存

Bengio等人新作：注意力可被视为RNN，新模型媲美Transformer，但超级省内存

Bengio等人新作：注意力可被视为RNN，新模型媲美Transformer，但超级省内存

既能像 Transformer 一样并行训练，推理时内存需求又不随 token 数线性递增，长上下文又有新思路了？

来自主题: AI技术研报

8066 点击 2024-05-25 18:07

极长序列、极快速度：面向新一代高效大语言模型的LASP序列并行

极长序列、极快速度：面向新一代高效大语言模型的LASP序列并行

极长序列、极快速度：面向新一代高效大语言模型的LASP序列并行

从国际顶流 GPT-4 128K、Claude 200K 到国内「当红炸子鸡」支持 200 万字上下文的 Kimi Chat，大语言模型（LLM）在长上下文技术上不约而同地卷起来了

来自主题: AI技术研报

6409 点击 2024-04-16 18:08

谷歌：假如AI大模型支持无限长上下文，会如何？

谷歌：假如AI大模型支持无限长上下文，会如何？

谷歌：假如AI大模型支持无限长上下文，会如何？

为解决大模型（LLMs）在处理超长输入序列时遇到的内存限制问题，本文作者提出了一种新型架构：Infini-Transformer，它可以在有限内存条件下，让基于Transformer的大语言模型（LLMs）高效处理无限长的输入序列。实验结果表明：Infini-Transformer在长上下文语言建模任务上超越了基线模型，内存最高可节约114倍。

来自主题: AI资讯

9340 点击 2024-04-14 11:32

谷歌爆改Transformer，“无限注意力”让1B小模型读完10部小说，114倍信息压缩

谷歌爆改Transformer，“无限注意力”让1B小模型读完10部小说，114倍信息压缩

谷歌爆改Transformer，“无限注意力”让1B小模型读完10部小说，114倍信息压缩

它通过将压缩记忆（compressive memory）整合到线性注意力机制中，用来处理无限长上下文

来自主题: AI资讯

9353 点击 2024-04-13 20:07

OpenAI最强竞对发现“越狱攻击”漏洞，大模型无一幸免

OpenAI最强竞对发现“越狱攻击”漏洞，大模型无一幸免

OpenAI最强竞对发现“越狱攻击”漏洞，大模型无一幸免

OpenAI的竞争对手Anthropic发现了一种称为"多样本越狱攻击"的漏洞，可以绕过大型语言模型的安全防护措施。这种攻击利用了模型的长上下文窗口，通过在提示中添加大量假对话来引导模型产生有害的反应。虽然已经采取了一些缓解措施，但该漏洞仍然存在。

来自主题: AI资讯

4704 点击 2024-04-04 09:46

OpenAI竞对用256轮对话「灌醉」大模型，Claude被骗造出炸弹！

OpenAI竞对用256轮对话「灌醉」大模型，Claude被骗造出炸弹！

OpenAI竞对用256轮对话「灌醉」大模型，Claude被骗造出炸弹！

就在刚刚，Anthropic发现了大模型的惊人漏洞。经过256轮对话后，Claude 2逐渐被「灌醉」，开始疯狂越狱，帮人类造出炸弹！谁能想到，它的超长上下文，反而成了软肋。

来自主题: AI技术研报

9624 点击 2024-04-03 15:46

多忽悠几次AI全招了！Anthropic警告：长上下文成越狱突破口，GPT羊驼Claude无一幸免

多忽悠几次AI全招了！Anthropic警告：长上下文成越狱突破口，GPT羊驼Claude无一幸免

多忽悠几次AI全招了！Anthropic警告：长上下文成越狱突破口，GPT羊驼Claude无一幸免

大模型厂商在上下文长度上卷的不可开交之际，一项最新研究泼来了一盆冷水——Claude背后厂商Anthropic发现，随着窗口长度的不断增加，大模型的“越狱”现象开始死灰复燃。无论是闭源的GPT-4和Claude 2，还是开源的Llama2和Mistral，都未能幸免。

来自主题: AI技术研报

8585 点击 2024-04-03 14:31

Mamba超强进化体一举颠覆Transformer！单张A100跑140K上下文

Mamba超强进化体一举颠覆Transformer！单张A100跑140K上下文

Mamba超强进化体一举颠覆Transformer！单张A100跑140K上下文

【新智元导读】52B的生产级Mamba大模型来了！这个超强变体Jamba刚刚打破世界纪录，它能正面硬刚Transformer，256K超长上下文窗口，吞吐量提升3倍，权重免费下载。

来自主题: AI技术研报

7362 点击 2024-03-29 16:43

开源11天，马斯克再发Grok-1.5！128K代码击败GPT-4

开源11天，马斯克再发Grok-1.5！128K代码击败GPT-4

开源11天，马斯克再发Grok-1.5！128K代码击败GPT-4

【新智元导读】马斯克「搞笑」模型刚刚升级到Grok-1.5，推理性能暴涨，支持128k长上下文。最重要的是，Grok-1.5的数学和代码能力大幅提升。

来自主题: AI技术研报

9487 点击 2024-03-29 16:34

AI大模型的长上下文，究竟意味着什么？

AI大模型的长上下文，究竟意味着什么？

AI大模型的长上下文，究竟意味着什么？

本文讨论了AI大模型的长上下文在生成式人工智能中的意义和影响。通过对Gemini 1.5和RAG技术的对比和分析，文章指出Gemini在处理长文档和长上下文方面表现出色，因此有人认为RAG技术已经过时。

来自主题: AI资讯

7254 点击 2024-03-20 09:02

上一页当前第6页,共8页下一页