AI资讯新闻榜单内容搜索-token

国产大模型第一梯队迎新势力：云知声发了个原生Agent大模型U2，再次捅破行业天花板

今天，“港股AGI第一股”云知声发布其最新通用大语言模型U2，该模型是由云知声自研的、基于快慢思考融合的MoE（混合专家）范式构建的通用大语言模型。U2跳出了传统大模型盲目堆参数、堆Token的内卷路径，实现了“小参数强能力、少Token高产出、低算力低成本”的进化。

来自主题: AI资讯

9476 点击 2026-06-08 20:56

黄仁勋押注Token经济：你用的软件正变成AI收费站

6月1日，在英伟达GTC舞台，黄仁勋聊AI工厂，聊智能体，反复念叨的也是这个Token：算力就是收入，算力就是利润。没有收入和利润，就是亏损。一座AI工厂这辈子能赚多少钱，看的就是它总共产出多少Token，也就是曲线下方的面积。一句话：谁能更快、更省电、更稳定地生产Token，谁就赚得多。

来自主题: AI资讯

8641 点击 2026-06-07 10:56

热门Harness项目OpenSquilla：拯救烧token烧到绝望的Agent们，估值1亿

OpenSquilla 是一个开源 Agent Harness 框架（https://github.com/opensquilla/opensquilla）。它在 Agent 应用和模型之间加了一层运行中枢。OpenSquilla 由上海基元律动科技有限公司开发。基元律动成立仅几个月后，已完成首轮融资，估值高达1亿美元。

来自主题: AI资讯

9587 点击 2026-06-06 10:34

10个神操作，让Hermes全天候主动干活

有人的Hermes像个聊天窗口，你喊一声它回一句，有人已经把Hermes用成了24小时不睡觉的AI助手，你不用说话，它自己就知道该干什么。这个人叫Sharbel，是海外视频平台YouTube大神，开源了一些Agent相关的项目。他在最新视频里公开了10个把Hermes从对话工具变成可用助手的操作，只要token充足，你的Hermes就可以7×24小时永不停转。

来自主题: AI资讯

8048 点击 2026-06-05 15:32

写代码不用编辑器！Transformer八子之一：单卡5090复刻Transformer所有研究！AI耗尽万亿Token学概念，正在用“外星人逻辑”泛化

“完全抛弃传统的代码编辑器，我直接告诉 AI 去修改代码。”

来自主题: AI资讯

7258 点击 2026-06-05 09:53

首次系统定义「Token经济学」，浙大&阿里联合发布大模型Agent资源分配新范式

当大模型 Agent 从实验室加速走向金融、医疗、代码开发等高价值场景，一个隐秘却致命的瓶颈正在浮现：Token 的指数级消耗正引发算力、协作与安全的系统性危机。传统 “堆算力、加参数” 的线性优化已触及天花板，我们该如何在 “输出质量” 与 “经济成本” 之间找到可持续的最优解？

来自主题: AI技术研报

8357 点击 2026-06-04 16:38

百度这次彻底治好了我的 Token 焦虑

感觉大家对追新这事，没那么上头了。

来自主题: AI资讯

9235 点击 2026-06-04 08:39

全球顶尖法律AI每月处理12万亿token，为什么不用OpenAI的云？

Harvey 是全球最大的法律 AI 公司，客户是世界顶尖律所和企业法务团队。你可能没怎么听说过它，但在法律行业，它基本上是那个大家已经在用、不需要再讨论的选择——就像律师界的 Salesforce，你不会问"要不要用"，只问"怎么接进来"。

来自主题: AI资讯

6685 点击 2026-06-03 14:31

ICML 2026 | 计算所联合ETH研究者提出WorldCache，视频世界模型近似无损提速3.7 倍

如果说扩散世界模型的瓶颈，是每一步去噪都要把同一个大 Transformer 再跑一遍，那么 WorldCache 的思路就是：不要再把所有 Token、所有时间步都当成同一件事。这篇工作把 “哪些内容适合缓存”和“哪些时刻必须重算” 拆开处理，在不重新训练模型、几乎不增加额外显存的前提下，把缓存真正做成了一套更贴合世界模型结构的推理策略。

来自主题: AI技术研报

7362 点击 2026-06-03 10:02

DeepSeek V4第一天就能跑！本地Token生产平台来了

“AI新物种”企业级Token生产平台TokenBox™。

来自主题: AI资讯

5721 点击 2026-06-03 09:27