AI资讯新闻榜单内容搜索-上下文

技术Blog-4 | 新一代InfLLM：可训练的稀疏注意力机制

本文深入剖析 MiniCPM4 采用的稀疏注意力结构 InfLLM v2。作为新一代基于 Transformer 架构的语言模型，MiniCPM4 在处理长序列时展现出令人瞩目的效率提升。传统Transformer的稠密注意力机制在面对长上下文时面临着计算开销迅速上升的趋势，这在实际应用中造成了难以逾越的性能瓶颈。

来自主题: AI技术研报

9362 点击 2025-06-16 15:24

AI记忆伪装被戳穿！GPT、DeepSeek等17款主流大模型根本记不住数字

最近，来自约翰・霍普金斯大学与中国人民大学的团队设计了三套实验，专门把关键线索藏在上下文之外，逼模型「凭记忆」作答，从而检验它们是否真的在脑海里保留了信息。

来自主题: AI技术研报

9512 点击 2025-06-15 15:16

AI真有希望考清北了！豆包1.6多模态推理发威，闯关数理化带图大题

豆包大模型1.6惊艳亮相，成为国内首款多模态SOTA模型，256k对话窗口，深度思考最长上下文。它不仅能看会想，还能动手操作GUI，国内最有潜力考清北。

来自主题: AI技术研报

9343 点击 2025-06-12 17:04

喝点VC｜a16z合伙人：开发者市场或成为AI首个真正意义上的万亿级市场；当前模型最致命的缺陷是永远不愿承认"我不知道"

问题越常见，所需上下文越少。比如"写个博客网站"这类典型教学案例，模型生成这类代码易如反掌。但面对缺乏训练数据的新颖需求时，你必须精确描述需求、提供API文档等完整上下文，难度会指数级上升。

来自主题: AI资讯

8451 点击 2025-06-08 11:36

强化学习解决长上下文推理问题：通义推出QwenLong-L1-32B

上下文长度达 13 万 token，适用于多段文档综合分析、金融、法律、科研等复杂领域任务。

来自主题: AI技术研报

7955 点击 2025-05-28 09:42

无限上下文、无限推理、无限输出，这个AI凭什么敢说"无限"？｜ Flowith 详细体验实测

Flowith 发布了它们最新的 Agent，Neo，这是世界上第一个能够做到无限上下文，无限推理步骤的 Agent，并且它还拥有着无限输出的能力。

来自主题: AI资讯

12129 点击 2025-05-22 15:08

首款无限Agent Neo深度实测，出道两年半的AI转正了

AI不再相信人类关于 Agent， flowith 给出了自己的答案 —— Neo

来自主题: AI资讯

10606 点击 2025-05-21 11:55

用AI做酷炫的数据看板HTML，并稳定更新数据，落地到实际工作中

得益于AI上下文和审美能力的提升，现在做HTML已经没什么门槛了，可以应用到很多方面，例如小红书封面、PPT、原型图、数据看板等等。

来自主题: AI技术研报

12707 点击 2025-05-21 10:53

谷歌ToC助手炸场，飞书ToB“知识问答”跟牌

北京时间5月21日凌晨，谷歌在每年一度的I/O大会上再度炸场——谷歌搜索的AI模式正式上线。其中，最受瞩目的一个功能是Personal Context（个人上下文）。北京时间5月21日凌晨，谷歌在每年一度的I/O大会上再度炸场——谷歌搜索的AI模式正式上线。其中，最受瞩目的一个功能是Personal Context（个人上下文）。

来自主题: AI资讯

10107 点击 2025-05-21 10:13

OpenAI诈骗？GPT-4.1正式上线ChatGPT，网友实测却大呼失望

GPT-4.1，在ChatGPT中可用了！现在，它不仅在API中开放，Plus、Pro和Team用户都可以使用。网友们兴奋地展开实测后，纷纷吐槽：OpenAI这是诈骗吧，说好的一百万超长上下文呢？

来自主题: AI资讯

12029 点击 2025-05-15 12:08