AI资讯新闻榜单内容搜索-token

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: token
小米计划30天内免费发100万亿Token,小米技术发文:Hermes Agent最近一月累计调用小米MiMo1.45万亿Token

小米计划30天内免费发100万亿Token,小米技术发文:Hermes Agent最近一月累计调用小米MiMo1.45万亿Token

小米计划30天内免费发100万亿Token,小米技术发文:Hermes Agent最近一月累计调用小米MiMo1.45万亿Token

5月12日,小米集团总裁卢伟冰发文:为回馈全球开发者,小米正式启动「MiMo Orbit 100T Token 计划」,面向全球 AI 用户免费发放 Token 权益,计划在 30 天内累计发放 100 万亿 Token。

来自主题: AI资讯
6995 点击    2026-05-12 15:21
ICLR 2026 Oral|大模型总爱「想太多」? DECS从源头消除冗余思考,实现推理token减半且性能不降反升

ICLR 2026 Oral|大模型总爱「想太多」? DECS从源头消除冗余思考,实现推理token减半且性能不降反升

ICLR 2026 Oral|大模型总爱「想太多」? DECS从源头消除冗余思考,实现推理token减半且性能不降反升

以 DeepSeek-R1、OpenAI GPT Thinking 为代表的大型推理模型,通过长达数千 token 的「思维链」在各类复杂推理任务中展现出卓越的性能。然而,这些模型普遍存在一个核心问题,即过度思考(overthinking) :

来自主题: AI技术研报
6359 点击    2026-05-12 14:31
Claude Code 每条请求暗藏一行「有毒」header,52K 上下文推理被拖慢 5 倍!NVIDIA 一个 flag 修好了

Claude Code 每条请求暗藏一行「有毒」header,52K 上下文推理被拖慢 5 倍!NVIDIA 一个 flag 修好了

Claude Code 每条请求暗藏一行「有毒」header,52K 上下文推理被拖慢 5 倍!NVIDIA 一个 flag 修好了

NVIDIA Dynamo 团队发现,Claude Code 向自定义端点发送请求时,prompt 最前面会带一行 session-specific billing header。这行 header 每个 session 都变,导致 52K token 的稳定前缀在 KV cache 中无法复用——TTFT 从 168ms 飙到 912ms。Dynamo 加了一个 `

来自主题: AI资讯
9885 点击    2026-05-11 11:01
大模型自信且短视!Next-ToBE破除Next Token预测诅咒 | ICLR'26

大模型自信且短视!Next-ToBE破除Next Token预测诅咒 | ICLR'26

大模型自信且短视!Next-ToBE破除Next Token预测诅咒 | ICLR'26

大模型常因只关注当前预测而显得短视。Next-ToBE通过调整训练目标,让模型在每一步预测时兼顾未来token分布,从而提升整体推理能力。

来自主题: AI技术研报
6415 点击    2026-05-11 09:03
首超龙虾!「爱马仕」Agent全球调用第一,小米MiMo是第一贡献模型

首超龙虾!「爱马仕」Agent全球调用第一,小米MiMo是第一贡献模型

首超龙虾!「爱马仕」Agent全球调用第一,小米MiMo是第一贡献模型

5月9日,Hermes Agent(昵称:爱马仕)登顶OpenRouter全球应用调用量榜首,首次超越OpenClaw(昵称:龙虾)。据OpenRouter应用Token消耗榜最新数据,这一Nous Research旗下开源自进化Agent产品登顶全球应用Token消耗榜,单日Token消耗量达到271B,也就是2710亿Token。

来自主题: AI资讯
8876 点击    2026-05-10 00:55
中国移动把Token玩明白了!10亿用户轻松接入AI算力新时代

中国移动把Token玩明白了!10亿用户轻松接入AI算力新时代

中国移动把Token玩明白了!10亿用户轻松接入AI算力新时代

中国移动发布Token运营体系,不是简单卖AI算力,而是要把网络、算力、模型、应用和10亿用户连接起来,打造AI时代的「新梦网」。

来自主题: AI资讯
8176 点击    2026-05-09 13:19
快手首个打工人Agent来了!工作秒变桌面软件:零代码、不烧token

快手首个打工人Agent来了!工作秒变桌面软件:零代码、不烧token

快手首个打工人Agent来了!工作秒变桌面软件:零代码、不烧token

最近快手上线的KroWork,解决的就是这件事。让没有技术背景的普通人也拥有制造这类工具的能力!你跟它说一遍需求,它帮你把活儿干完,然后直接把整个流程变成一个可以直接打开的、有界面的、能反复使用的本地软件。

来自主题: AI资讯
9966 点击    2026-05-08 14:10
token级,精准控制生成长度:3B模型击败GPT 5.4、Claude

token级,精准控制生成长度:3B模型击败GPT 5.4、Claude

token级,精准控制生成长度:3B模型击败GPT 5.4、Claude

LenVM将长度建模提升到token级别,开辟可扩展价值预训练的新维度——3B开源模型精确长度控制全面击败GPT-5.4、Claude-Opus-4-6等顶级闭源模型;相同token预算下推理准确率提升10倍(63% vs 6%);沿模型规模、数据量、采样数三轴无饱和scaling的value pretraining

来自主题: AI技术研报
5642 点击    2026-05-08 14:06
大模型价格战背后,真正稀缺的不是Token

大模型价格战背后,真正稀缺的不是Token

大模型价格战背后,真正稀缺的不是Token

Anthropic在四月初发布Mythos,距离现在已经近一个月。行业内对于它的讨论,更多的关注点在于“它有多强”,但我更想聊聊它的“发布方式”。

来自主题: AI资讯
8812 点击    2026-05-08 09:53