AI资讯新闻榜单内容搜索-Token

微信、清华连续自回归模型CALM，新范式实现从「离散词元」到「连续向量」转变

众所周知，大型语言模型（LLM）的根本运作方式是预测下一个 token（词元），能够保证生成的连贯性和逻辑性，但这既是 LLM 强大能力的「灵魂」所在，也是其枷锁，将导致高昂的计算成本和响应延迟。可

来自主题: AI技术研报

7394 点击 2025-11-09 10:21

两周复刻DeepSeek-OCR！两人小团队还原低token高压缩核心，换完解码器更实用

两人小团队，仅用两周就复刻了之前被硅谷夸疯的DeepSeek-OCR？？复刻版名叫DeepOCR，还原了原版低token高压缩的核心优势，还在关键任务上追上了原版的表现。完全开源，而且无需依赖大规模的算力集群，在两张H200上就能完成训练。

来自主题: AI资讯

8177 点击 2025-11-07 15:22

NeurIPS 2025 Spotlight | 选择性知识蒸馏精准过滤：推测解码加速器AdaSPEC来了

目前，最先进的对齐方法是使用知识蒸馏（Knowledge Distillation, KD）在所有 token 上最小化 KL 散度。然而，最小化全局 KL 散度并不意味着 token 的接受率最大化。由于小模型容量受限，草稿模型往往难以完整吸收目标模型的知识，导致直接使用蒸馏方法的性能提升受限。在极限场景下，草稿模型和目标模型的巨大尺寸差异甚至可能导致训练不收敛。

来自主题: AI技术研报

8059 点击 2025-11-07 14:57

推翻「预测下一个token」范式！微信AI新研究：把token压缩成连续向量更具性价比

大模型一个token一个token生成，效率太低怎么办？

来自主题: AI技术研报

7606 点击 2025-11-06 16:29

AI跌价900倍，连一瓶矿泉水都比它贵！

过去一年，AI模型的价格暴跌百倍！同样一句话，去年要10块，现在只要几分钱。可与此同时，家政、育儿、心理咨询、维修.....这些「手工活」越来越贵。科技正在疯狂通缩，生活却越来越通胀。这不是经济学笑话，而是Jevons与Baumol共同制造的现实：当机器更聪明，人工就更昂贵。

来自主题: AI资讯

8663 点击 2025-11-06 09:43

英伟达帮你省钱，让大模型推理「短而精」，速度快5倍

大模型推理到底要不要「长篇大论」？过去一年，OpenAI o 系列、DeepSeek-R1、Qwen 等一系列推理模型，把「长链思维」玩到极致：答案更准了，但代价是推理链越来越长、Token 消耗爆炸、响应速度骤降。

来自主题: AI技术研报

6650 点击 2025-11-04 16:09

AEPO：智能体熵平衡策略优化，让探索更稳，推理更深！

AEPO 系统性揭示了「高熵 Rollout 采样坍缩」和「高熵梯度裁剪」问题，并设计了「动态熵平衡 Rollout 采样」与「熵平衡策略优化」两项核心机制。前者通过熵预监控与连续分支惩罚实现全局与局部探索预算的自适应分配，后者在策略更新阶段引入梯度停止与熵感知优势估计以保留高熵 token 的探索梯度。

来自主题: AI技术研报

7447 点击 2025-11-02 10:32

字节发布通用游戏智能体！5000亿token训练，用鼠标键盘吊打GPT-5！

Game-TARS基于统一、可扩展的键盘—鼠标动作空间训练，可在操作系统、网页与模拟环境中进行大规模预训练。依托超5000亿标注量级的多模态训练数据，结合稀疏推理（Sparse-Thinking）与衰减持续损失（decaying continual loss），大幅提升了智能体的可扩展性和泛化性。

来自主题: AI技术研报

7873 点击 2025-11-01 09:42

内存直降50%，token需求少56%！用视觉方式处理长文本

在NeurIPS 2025论文中，来自「南京理工大学、中南大学、南京林业大学」的研究团队提出了一个极具突破性的框架——VIST（Vision-centric Token Compression in LLM），为大语言模型的长文本高效推理提供了全新的「视觉解决方案」。值得注意的是，这一思路与近期引起广泛关注的DeepSeek-OCR的核心理念不谋而合。

来自主题: AI技术研报

8606 点击 2025-11-01 09:23

重新定义跨模态生成的流匹配范式，VAFlow让视频「自己发声」

在多模态生成领域，由视频生成音频（Video-to-Audio，V2A）的任务要求模型理解视频语义，还要在时间维度上精准对齐声音与动态。早期的 V2A 方法采用自回归（Auto-Regressive）的方式将视频特征作为前缀来逐个生成音频 token，或者以掩码预测（Mask-Prediction）的方式并行地预测音频 token，逐步生成完整音频。

来自主题: AI技术研报

7586 点击 2025-10-31 15:00