AI资讯新闻榜单内容搜索-大模

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 大模
先解行为,再训Agent:CMU开源首份Agentic Search日志数据,把Agent拆开给你看

先解行为,再训Agent:CMU开源首份Agentic Search日志数据,把Agent拆开给你看

先解行为,再训Agent:CMU开源首份Agentic Search日志数据,把Agent拆开给你看

在大模型驱动的 Agentic Search 日益常态化的背景下,真实环境中智能体 “如何发查询、如何改写、是否真正用上检索信息” 一直缺乏系统刻画与分析。

来自主题: AI技术研报
7818 点击    2026-02-09 14:55
小米给KV Cache减负80%!MiMo团队推出混合稀疏注意力架构

小米给KV Cache减负80%!MiMo团队推出混合稀疏注意力架构

小米给KV Cache减负80%!MiMo团队推出混合稀疏注意力架构

小米MiMo大模型团队,加入AI拜年战场——推出HySparse,一种面向Agent时代的混合稀疏注意力架构。

来自主题: AI技术研报
7138 点击    2026-02-08 11:53
ICLR 2026|UIUC:一行代码彻底解决LLM推理的过度思考!

ICLR 2026|UIUC:一行代码彻底解决LLM推理的过度思考!

ICLR 2026|UIUC:一行代码彻底解决LLM推理的过度思考!

2025 年 1 月 20 日,DeepSeek 发布了推理大模型 DeepSeek-R1,在学术界和工业界引发了对大模型强化学习方法的广泛关注与研究热潮。 研究者发现,在数学推理等具有明确答案的任务

来自主题: AI技术研报
6088 点击    2026-02-08 11:52
具身大模型LaST₀:双臂/移动/灵巧手全面新SOTA,首次引入隐空间时空思维链

具身大模型LaST₀:双臂/移动/灵巧手全面新SOTA,首次引入隐空间时空思维链

具身大模型LaST₀:双臂/移动/灵巧手全面新SOTA,首次引入隐空间时空思维链

LaST₀团队 投稿 量子位 | 公众号 QbitAI 近日,至简动力、北京大学、香港中文大学、北京人形机器人创新中心提出了一种名为LaST₀的全新隐空间推理VLA模型,在基于Transformer混

来自主题: AI技术研报
5705 点击    2026-02-08 11:50
神秘模型「Pony Alpha」引外网热议,它会是国产大模型中的谁?

神秘模型「Pony Alpha」引外网热议,它会是国产大模型中的谁?

神秘模型「Pony Alpha」引外网热议,它会是国产大模型中的谁?

外网都在好奇: 全球模型服务平台 OpenRouter 上这个搜索第一的神秘模型是哪家的? 这个匿名模型叫做「Pony Alpha」。根据 OpenRouter 官方的说法,它是新一代的通用大模型,在编程、逻辑推理和角色扮演方面表现突出,并针对 Agent 工作流进行了优化,具有极高的工具调用准确率。

来自主题: AI资讯
8259 点击    2026-02-08 10:59
三个月完成两轮融资!前蚂蚁大模型首席架构师创业,发布行业首款 GEO 产品化 AI Agent

三个月完成两轮融资!前蚂蚁大模型首席架构师创业,发布行业首款 GEO 产品化 AI Agent

三个月完成两轮融资!前蚂蚁大模型首席架构师创业,发布行业首款 GEO 产品化 AI Agent

营销,正式进入 AI 时代。 近日,专注于答案引擎优化(AEO)的 AI Agent 平台 PallasAI 宣布完成数千万人民币融资,由香港上市公司有赞(8083.HK)独家投资。这是该公司三个月内

来自主题: AI资讯
8649 点击    2026-02-07 14:22
延迟下降20×,token减少4.4×!突破多智能体「共识」瓶颈

延迟下降20×,token减少4.4×!突破多智能体「共识」瓶颈

延迟下降20×,token减少4.4×!突破多智能体「共识」瓶颈

过去一年,LLM Agent几乎成为所有 AI 研究团队与工业界的共同方向。OpenAI在持续推进更强的推理与工具使用能力,Google DeepMind将推理显式建模为搜索问题,Anthropic则通过规范与自我批判提升模型可靠性。

来自主题: AI技术研报
9592 点击    2026-02-07 14:04
Agentic Memory开年就卷起来了?刚刚,华人团队MemBrain拿下多项SOTA!

Agentic Memory开年就卷起来了?刚刚,华人团队MemBrain拿下多项SOTA!

Agentic Memory开年就卷起来了?刚刚,华人团队MemBrain拿下多项SOTA!

2026 刚来到 2 月,无论是底层模型大厂还是初创公司统统加速开卷,其中 Agentic Memory 方向的快速进化更是把大模型的能力上限推向了 NEXT LEVEL!

来自主题: AI资讯
9647 点击    2026-02-06 11:40