AI资讯新闻榜单内容搜索-长上下文

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 长上下文

MIT韩松团队长上下文LLM推理高效框架DuoAttention：单GPU实现330万Token上下文推理

MIT韩松团队长上下文LLM推理高效框架DuoAttention：单GPU实现330万Token上下文推理

MIT韩松团队长上下文LLM推理高效框架DuoAttention：单GPU实现330万Token上下文推理

TL;DR：DuoAttention 通过将大语言模型的注意力头分为检索头（Retrieval Heads，需要完整 KV 缓存）和流式头（Streaming Heads，只需固定量 KV 缓存），大幅提升了长上下文推理的效率，显著减少内存消耗、同时提高解码（Decoding）和预填充（Pre-filling）速度，同时在长短上下文任务中保持了准确率。

来自主题: AI技术研报

4739 点击 2024-10-24 11:33

米开朗基罗怎么说？谷歌DeepMind推出长上下文评估新框架

米开朗基罗怎么说？谷歌DeepMind推出长上下文评估新框架

米开朗基罗怎么说？谷歌DeepMind推出长上下文评估新框架

近日，来自谷歌DeepMind的研究人员提出了Michelangelo，「用米开朗基罗的观点」来测量任意上下文长度的基础模型性能。

来自主题: AI技术研报

4752 点击 2024-10-12 11:07

长上下文能取代RAG吗？

长上下文能取代RAG吗？

长上下文能取代RAG吗？

曾几何时，LLM还是憨憨的。脑子里的知识比较混乱，同时上下文窗口长度也有限。检索增强生成（RAG）的出现在很大程度上提升了模型的性能。

来自主题: AI资讯

4785 点击 2024-09-30 15:28

首个Mamba+Transformer混合架构多模态大模型来了，实现单卡千图推理

首个Mamba+Transformer混合架构多模态大模型来了，实现单卡千图推理

首个Mamba+Transformer混合架构多模态大模型来了，实现单卡千图推理

扩展多模态大语言模型（MLLMs）的长上下文能力对于视频理解、高分辨率图像理解以及多模态智能体至关重要。这涉及一系列系统性的优化，包括模型架构、数据构建和训练策略，尤其要解决诸如随着图像增多性能下降以及高计算成本等挑战。

来自主题: AI技术研报

8908 点击 2024-09-21 18:19

Jamba 1.5发布，最长上下文，非Transformer架构首次成功领先

Jamba 1.5发布，最长上下文，非Transformer架构首次成功领先

Jamba 1.5发布，最长上下文，非Transformer架构首次成功领先

Jamba是第一个基于 Mamba 架构的生产级模型。Mamba 是由卡内基梅隆大学和普林斯顿大学的研究人员提出的新架构，被视为 Transformer 架构的有力挑战者。

来自主题: AI资讯

9176 点击 2024-08-24 10:07

支持1024帧、准确率近100％，英伟达「LongVILA」开始发力长视频

支持1024帧、准确率近100％，英伟达「LongVILA」开始发力长视频

支持1024帧、准确率近100％，英伟达「LongVILA」开始发力长视频

现在，长上下文视觉语言模型（VLM）有了新的全栈解决方案 ——LongVILA，它集系统、模型训练与数据集开发于一体。

来自主题: AI技术研报

10301 点击 2024-08-21 14:20

长上下文能力只是吹牛？最强GPT-4o正确率仅55.8%，开源模型不如瞎蒙

长上下文能力只是吹牛？最强GPT-4o正确率仅55.8%，开源模型不如瞎蒙

长上下文能力只是吹牛？最强GPT-4o正确率仅55.8%，开源模型不如瞎蒙

当今的LLM已经号称能够支持百万级别的上下文长度，这对于模型的能力来说，意义重大。但近日的两项独立研究表明，它们可能只是在吹牛，LLM实际上并不能理解这么长的内容。

来自主题: AI资讯

5598 点击 2024-07-23 16:10

Gemini 1.5 Pro装进机器人，参观一遍公司就能礼宾、带路

Gemini 1.5 Pro装进机器人，参观一遍公司就能礼宾、带路

Gemini 1.5 Pro装进机器人，参观一遍公司就能礼宾、带路

长上下文大模型帮助机器人理解世界。

来自主题: AI资讯

5057 点击 2024-07-13 19:53

英伟达新研究：上下文长度虚标严重，32K性能合格的都不多

英伟达新研究：上下文长度虚标严重，32K性能合格的都不多

英伟达新研究：上下文长度虚标严重，32K性能合格的都不多

无情戳穿“长上下文”大模型的虚标现象

来自主题: AI技术研报

10075 点击 2024-06-03 15:39

速度秒杀GPT-4o！Mistral开源首个22B代码模型破记录，支持80+编程语言

速度秒杀GPT-4o！Mistral开源首个22B代码模型破记录，支持80+编程语言

速度秒杀GPT-4o！Mistral开源首个22B代码模型破记录，支持80+编程语言

就在刚刚，法国AI初创公司Mistral发布了自家首款代码生成模型Codestral。不仅支持32K长上下文窗口以及80多种编程语言，而且还用22B的参数量取得了与70B的Llama 3相近的性能。目前，已经开放API与IDE插件供用户使用。

来自主题: AI技术研报

10792 点击 2024-05-30 15:16

上一页当前第5页,共8页下一页