AI资讯新闻榜单内容搜索-token

Discrete Tokenization：多模态大模型的关键基石，首个系统化综述发布

近年来，大语言模型（LLM）在语言理解、生成和泛化方面取得了突破性进展，并广泛应用于各种文本任务。随着研究的深入，人们开始关注将 LLM 的能力扩展至非文本模态，例如图像、音频、视频、图结构、推荐系统等。

来自主题: AI技术研报

6837 点击 2025-08-06 12:18

字节Seed发布扩散语言模型，推理速度达2146 tokens/s，比同规模自回归快5.4倍

用扩散模型写代码，不仅像开了倍速，改起来还特别灵活！字节Seed最新发布扩散语言模型Seed Diffusion Preview，这款模型主要聚焦于代码生成领域，它的特别之处在于采用了离散状态扩散技术，在推理速度上表现出色。

来自主题: AI资讯

7049 点击 2025-08-01 16:04

又一SOTA级开源模型！阶跃Step-3多模态推理登顶，百万token解码成本不到4毛钱

又一个SOTA基础模型开源，而且依然是国产。刚刚，阶跃星辰兑现了WAIC上的承诺，将最新多模态推理模型Step-3正式开源！在MMMU等多个多模态榜单上，它一现身就取得了开源多模态推理模型新SOTA的成绩。

来自主题: AI技术研报

7480 点击 2025-08-01 12:52

Claude Code唯一对手！？AI编程黑马AmpCode崛起的秘密：不设token上限，放手让AI自己死磕代码

近期，AI 编程领域又一匹 AI Coding 黑马正在快速崛起。

来自主题: AI资讯

9603 点击 2025-07-31 18:16

国产GPU跑满血DeepSeek，已经可以100 tokens/s了！

放眼当下，到底哪个芯片跑满血DeepSeek是最快的？答案很意外——不是你以为的英伟达，而是一家国产GPU。因为现在它的速度，已经直接来到了100 tokens/s！

来自主题: AI资讯

6636 点击 2025-07-27 14:04

突破单token预测局限！南洋理工首次将多token预测引入微调，编程任务准确率提升11.67%

告别Next-token，现在模型微调阶段就能直接多token预测！

来自主题: AI技术研报

8414 点击 2025-07-25 10:00

四款扩散大语言模型全部破防？上交&上海AI Lab发现致命安全缺陷

扩散语言模型（Diffusion-based LLMs，简称 dLLMs）以其并行解码、双向上下文建模、灵活插入masked token进行解码的特性，成为一个重要的发展方向。

来自主题: AI技术研报

8725 点击 2025-07-23 15:04

首篇潜空间推理综述！模型思考不必依赖Token，带宽暴增2700+倍

大模型在潜空间中推理，带宽能达到普通（显式）思维链（CoT）的2700多倍？

来自主题: AI技术研报

8517 点击 2025-07-16 15:26

无Tokenizer时代真要来了？Mamba作者再发颠覆性论文，挑战Transformer

最近，Mamba 作者之一 Albert Gu 又发新研究，他参与的一篇论文《 Dynamic Chunking for End-to-End Hierarchical Sequence Modeling 》提出了一个分层网络 H-Net，其用模型内部的动态分块过程取代 tokenization，从而自动发现和操作有意义的数据单元。

来自主题: AI技术研报

7425 点击 2025-07-13 11:37

「Tokens是胡扯」，Mamba作者抛出颠覆性观点，揭露Transformer深层缺陷

「Tokenization（分词）是 Transformer 模型为弥补自身缺陷不得不戴上的枷锁。」

来自主题: AI技术研报

6074 点击 2025-07-10 13:16