小米给KV Cache减负80%!MiMo团队推出混合稀疏注意力架构
小米给KV Cache减负80%!MiMo团队推出混合稀疏注意力架构小米MiMo大模型团队,加入AI拜年战场——推出HySparse,一种面向Agent时代的混合稀疏注意力架构。
小米MiMo大模型团队,加入AI拜年战场——推出HySparse,一种面向Agent时代的混合稀疏注意力架构。
随着 AI 智能体(Agent)能力日益强大,其自主行为带来的安全风险也愈发复杂。现有安全工具往往只能给出「安全 / 不安全」的简单判断,无法告知我们风险的根源。为此,上海人工智能实验室正式开源 Ag
一直以来,神经网络的激活函数就像是 AI 引擎中的火花塞。从早期的 Sigmoid、Tanh,到后来统治业界的 ReLU,再到近年来的 GELU 和 Swish,每一次激活函数的演进都伴随着模型性能的提升。但长期以来,寻找最佳激活函数往往依赖于人类直觉或有限的搜索空间。
外网都在好奇: 全球模型服务平台 OpenRouter 上这个搜索第一的神秘模型是哪家的? 这个匿名模型叫做「Pony Alpha」。根据 OpenRouter 官方的说法,它是新一代的通用大模型,在编程、逻辑推理和角色扮演方面表现突出,并针对 Agent 工作流进行了优化,具有极高的工具调用准确率。
营销,正式进入 AI 时代。 近日,专注于答案引擎优化(AEO)的 AI Agent 平台 PallasAI 宣布完成数千万人民币融资,由香港上市公司有赞(8083.HK)独家投资。这是该公司三个月内
智东西2月6日报道,据Z Finance独家获悉,近日,答案引擎优化(AEO)AI Agent平台PallasAI完成数千万人民币的天使轮融资,由香港上市公司有赞独家投资。这是PallasAI三个月内获得的第二笔投资。
2026 年 1 月,这一个月所发生的变化,相当于过去 25 年里任意半年的总和。这是一个大事件频发的时期,以至于像 Clawdbot 这样的产品,都能在一周之内三次更名。
过去一年,LLM Agent几乎成为所有 AI 研究团队与工业界的共同方向。OpenAI在持续推进更强的推理与工具使用能力,Google DeepMind将推理显式建模为搜索问题,Anthropic则通过规范与自我批判提升模型可靠性。
最近这两天,AI圈子里可谓是哀鸿遍野,X平台以及各个群友都反馈:自己的 Gemini Pro一年的学生优惠会员到期了/被收回了。截图一看,症状出奇的一致:右上角的 Pro标识消失,左下角则会显示“你的 Google AI Pro订阅已到期”。
2026 刚来到 2 月,无论是底层模型大厂还是初创公司统统加速开卷,其中 Agentic Memory 方向的快速进化更是把大模型的能力上限推向了 NEXT LEVEL!