AI资讯新闻榜单内容搜索-上下文

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 上下文
1M长上下文,满血版Gemini 2.0又一次登上Chatbot Arena榜首

1M长上下文,满血版Gemini 2.0又一次登上Chatbot Arena榜首

1M长上下文,满血版Gemini 2.0又一次登上Chatbot Arena榜首

就在国内各家大模型厂商趁年底疯狂卷的时候,太平洋的另一端也没闲着。 就在今天,谷歌发布了 Gemini 2.0 Flash Thinking 推理模型的加强版,并再次登顶 Chatbot Arena 排行榜。

来自主题: AI资讯
9842 点击    2025-01-22 18:40
ShowMeAI周刊 No.15 | 上周最有讨论度的6个AI话题:自由画布类产品密集更新、多主体一致成发展趋势、AGI、开源…

ShowMeAI周刊 No.15 | 上周最有讨论度的6个AI话题:自由画布类产品密集更新、多主体一致成发展趋势、AGI、开源…

ShowMeAI周刊 No.15 | 上周最有讨论度的6个AI话题:自由画布类产品密集更新、多主体一致成发展趋势、AGI、开源…

自由画布类 AIGC 工具:从近期新品(更新)窥见发展趋势——自律才能给我自由。图像 & 视频多主体一致功能:模型上下文能力的重要体现,未来各家模型的标配。指定 AI 生图里的文字,我找到了 9 种解决方案,其中有 2 种快过时了

来自主题: AI资讯
8720 点击    2025-01-21 22:57
MiniMax开源4M超长上下文新模型!性能比肩DeepSeek-v3、GPT-4o

MiniMax开源4M超长上下文新模型!性能比肩DeepSeek-v3、GPT-4o

MiniMax开源4M超长上下文新模型!性能比肩DeepSeek-v3、GPT-4o

开源模型上下文窗口卷到超长,达400万token! 刚刚,“大模型六小强”之一MiniMax开源最新模型—— MiniMax-01系列,包含两个模型:基础语言模型MiniMax-Text-01、视觉多模态模型MiniMax-VL-01。

来自主题: AI技术研报
8014 点击    2025-01-15 15:10
仅缩小视觉Token位置编码间隔,轻松让多模态大模型理解百万Token!清华大学,香港大学,上海AI Lab新突破

仅缩小视觉Token位置编码间隔,轻松让多模态大模型理解百万Token!清华大学,香港大学,上海AI Lab新突破

仅缩小视觉Token位置编码间隔,轻松让多模态大模型理解百万Token!清华大学,香港大学,上海AI Lab新突破

随着语言大模型的成功,视觉 - 语言多模态大模型 (Vision-Language Multimodal Models, 简写为 VLMs) 发展迅速,但在长上下文场景下表现却不尽如人意,这一问题严重制约了多模态模型在实际应用中的潜力。

来自主题: AI技术研报
8060 点击    2025-01-15 14:23
最强代码模型刷新:Mistral新品上线即登顶,上下文窗口增至256k

最强代码模型刷新:Mistral新品上线即登顶,上下文窗口增至256k

最强代码模型刷新:Mistral新品上线即登顶,上下文窗口增至256k

“欧洲版 OpenAI” Mistral 的代码模型 CodeStral,又上新了! 而且与 DeepSeek V2.5 和 Claude 3.5 平起平坐,共同位列 Copilot 竞技场第一名。

来自主题: AI资讯
7989 点击    2025-01-14 15:42
让「幻觉」无处遁形!谷歌DeepMind全新基准,三代Gemini同台霸榜

让「幻觉」无处遁形!谷歌DeepMind全新基准,三代Gemini同台霸榜

让「幻觉」无处遁形!谷歌DeepMind全新基准,三代Gemini同台霸榜

谷歌推出的FACTS Grounding基准测试,能评估AI模型在特定上下文中生成准确文本的能力,有助于提升模型的可靠性;通过去除不满足用户需求的回复,确保了评分的准确性和模型排名的公正性。

来自主题: AI技术研报
9114 点击    2025-01-13 13:47
传统PC巨头IBM发布了最新的Granite3.1模型,跑分超过Llama3.1、Qwen2.5 和谷歌的 Gemma2

传统PC巨头IBM发布了最新的Granite3.1模型,跑分超过Llama3.1、Qwen2.5 和谷歌的 Gemma2

传统PC巨头IBM发布了最新的Granite3.1模型,跑分超过Llama3.1、Qwen2.5 和谷歌的 Gemma2

IBM 正式发布了其新一代开源大语言模型 Granite 3.1,这是一组轻量级、先进的开源基础模型,支持多语言、代码生成、推理和工具使用,能够在有限的计算资源上运行。这一系列模型具备 128K 的扩展上下文长度、嵌入模型、内置的幻觉检测功能以及性能的显著提升。

来自主题: AI资讯
9770 点击    2024-12-25 09:57