AI资讯新闻榜单内容搜索-上下文

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 上下文
Kimi最强编程模型Kimi K2.7 Code来了:Token消耗直降30%,过度思考有救了,附一手实测

Kimi最强编程模型Kimi K2.7 Code来了:Token消耗直降30%,过度思考有救了,附一手实测

Kimi最强编程模型Kimi K2.7 Code来了:Token消耗直降30%,过度思考有救了,附一手实测

今天,月之暗面发布并开源Kimi K2.7 Code编程模型,参数量达1.1万亿,提供256K上下文窗口。这一模型重点提升了长上下文编程场景的指令遵循能力、长程编程任务的性能表现,并且大幅改善了在长程任务中的过度思考倾向,平均token消耗减少30%。

来自主题: AI资讯
10075 点击    2026-06-13 00:31
一篇综述看懂 agent context compression:怎么压、压什么、谁来压

一篇综述看懂 agent context compression:怎么压、压什么、谁来压

一篇综述看懂 agent context compression:怎么压、压什么、谁来压

LLM Agent 做长任务时,真正让人头疼的往往不是模型不会推理,而是上下文开始失控:前几步还很清楚,后面就忘约束、丢状态、重复试错,最后把任务跑成事故现场。

来自主题: AI技术研报
7102 点击    2026-06-11 14:32
一个8×8矩阵,让大模型「记住」长对话:Mind Lab联合NTU、复旦推出δ-mem,参数仅0.12%

一个8×8矩阵,让大模型「记住」长对话:Mind Lab联合NTU、复旦推出δ-mem,参数仅0.12%

一个8×8矩阵,让大模型「记住」长对话:Mind Lab联合NTU、复旦推出δ-mem,参数仅0.12%

不扩上下文窗口、不换骨干架构、不做全参数微调 —— 只需要一个 8×8 的在线状态矩阵,就能让冻结的 Transformer 拥有真正的长期记忆。

来自主题: AI技术研报
10075 点击    2026-06-08 14:50
超越TurboQuant:Together AI把2-bit KV Cache推向真实服务

超越TurboQuant:Together AI把2-bit KV Cache推向真实服务

超越TurboQuant:Together AI把2-bit KV Cache推向真实服务

长上下文模型越来越能“记”,但真正让它们跑到线上时,最先顶不住的往往不是算力,而是KV Cache。

来自主题: AI技术研报
5642 点击    2026-06-05 09:53
什么是AI硬件的最佳形态?|《原点 Talk》Vol.6

什么是AI硬件的最佳形态?|《原点 Talk》Vol.6

什么是AI硬件的最佳形态?|《原点 Talk》Vol.6

过去三年来,所有人都在卷模型,参数更大、推理更深、上下文更长。但当Claude Code把Anthropic推到杀手级应用的位置、当OpenAI的Codex已经能替你写完一整本游记,问题终于绕了回来: 这些越来越像「人」的模型,到底要装进什么样的载体里,才算真正走进生活?

来自主题: AI资讯
6852 点击    2026-06-03 09:28
MiniMax 低调发布 M3 和 MiniMax Code,我们测完后有几点感受

MiniMax 低调发布 M3 和 MiniMax Code,我们测完后有几点感受

MiniMax 低调发布 M3 和 MiniMax Code,我们测完后有几点感受

前沿的 Coding 能力、1M 的上下文窗口,还有原生的多模态

来自主题: AI产品测评
8178 点击    2026-06-02 11:58
牛津、英伟达等提出记忆压缩新范式:训练时让模型学会断舍离

牛津、英伟达等提出记忆压缩新范式:训练时让模型学会断舍离

牛津、英伟达等提出记忆压缩新范式:训练时让模型学会断舍离

2026 年初,各大 AI 厂商在上下文窗口长度上展开激烈角逐。Google 的 Gemini 3 Pro 已支持 100 万级 token 上下文,Meta 的 Llama 4 Scout 更宣称可处理 1000 万 token。GPT-5 系列也在快速推进长上下文能力。

来自主题: AI技术研报
10286 点击    2026-06-02 11:23
MiniMax M3:前沿 Coding 能力、1M 上下文、原生多模态,一个模型全给你

MiniMax M3:前沿 Coding 能力、1M 上下文、原生多模态,一个模型全给你

MiniMax M3:前沿 Coding 能力、1M 上下文、原生多模态,一个模型全给你

MiniMax M3 今日正式发布。MiniMax M3 在编程和智能体等专业任务上达到了前沿的能力。它使用了我们提出的全新注意力架构 MSA (MiniMax Sparse Attention),最高支持 1M 超长上下文。如外界所期待的那样,它也是一个原生多模态模型,支持图片和视频的输入,并能操作电脑桌面。

来自主题: AI资讯
9924 点击    2026-06-01 09:49