AI资讯新闻榜单内容搜索-Dyna

字节Seed：大概念模型来了，推理的何必是下一个token

LLM的下一个推理单位，何必是Token？刚刚，字节Seed团队发布最新研究——DLCM（Dynamic Large Concept Models）将大模型的推理单位从token（词）动态且自适应地推到了concept（概念）层级。

来自主题: AI技术研报

9092 点击 2026-01-04 21:01

动态RAG性能提升14个点！用4万亿token教会大模型「什么时候该检索」

近日，来自伊利诺伊大学芝加哥分校、纽约大学、与蒙纳士大学的联合团队提出QuCo-RAG，首次跳出「从模型自己内部信号来评估不确定性」的思维定式，转而用预训练语料的客观统计来量化不确定性，

来自主题: AI技术研报

8012 点击 2026-01-01 10:13

12毫秒暴露自动驾驶致命缺陷，北航新研究实现场景感知的动态物理对抗攻击｜TPAMI2025

近日，部分L3级自动驾驶车型已经通过工信部批准正式上路，这标志着这我国自动驾驶产业的新阶段。

来自主题: AI技术研报

6484 点击 2025-12-29 09:04

DeepSeek、Gemini谁更能提供情感支持？趣丸×北大来了波情绪轨迹动态评估

近日，由趣丸科技与北京大学软件工程国家工程研究中心共同发表的《Detecting Emotional Dynamic Trajectories: An Evaluation Framework for Emotional Support in Language Models（检测情感动态轨迹：大语言模型情感支持的评估框架）》论文，获 AAAI 2026 录用。

来自主题: AI技术研报

8402 点击 2025-12-08 14:13

NeurIPS 2025 | DynaAct：DeepSeek R1之外，探索大模型推理的另一条道路

大模型推理的爆发，实际源于 scaling 范式的转变：从 train-time scaling 到 test-time scaling（TTS），即将更多的算力消耗部署在 inference 阶段。典型的实现是以 DeepSeek r1 为代表的 long CoT 方法：通过增加思维链的长度来获得答案精度的提升。那么 long CoT 是 TTS 的唯一实现吗？

来自主题: AI技术研报

7909 点击 2025-11-30 09:30

老黄刚投的具身智能公司：三个华人创办

老黄又投了一家具身智能公司！

来自主题: AI资讯

5373 点击 2025-09-22 11:05

榨干GPU性能，中兴Mariana（马里亚纳）突破显存壁垒

当大语言模型（LLM）走向千行百业，推理效率与显存成本的矛盾日益尖锐。

来自主题: AI资讯

7862 点击 2025-08-26 19:21

让强化学习快如闪电：FlashRL一条命令实现极速Rollout，已全部开源

在今年三月份，清华 AIR 和字节联合 SIA Lab 发布了 DAPO，即 Decoupled Clip and Dynamic sAmpling Policy Optimization（解耦剪辑和动态采样策略优化）。

来自主题: AI技术研报

7767 点击 2025-08-13 11:27

ICCV 2025 | 小红书AIGC团队提出图像和视频换脸新算法DynamicFace

近年来，扩散模型在图像与视频合成领域展现出前所未有的生成能力，为人脸生成与编辑技术按下了加速键。特别是一张静态人脸驱动任意表情、姿态乃至光照的梦想，正在走向大众工具箱，并在三大场景展现巨大潜力

来自主题: AI技术研报

8331 点击 2025-08-12 16:10

无Tokenizer时代真要来了？Mamba作者再发颠覆性论文，挑战Transformer

最近，Mamba 作者之一 Albert Gu 又发新研究，他参与的一篇论文《 Dynamic Chunking for End-to-End Hierarchical Sequence Modeling 》提出了一个分层网络 H-Net，其用模型内部的动态分块过程取代 tokenization，从而自动发现和操作有意义的数据单元。

来自主题: AI技术研报

7839 点击 2025-07-13 11:37

AI资讯新闻榜单内容搜索-Dyna

字节Seed：大概念模型来了，推理的何必是下一个token

动态RAG性能提升14个点！用4万亿token教会大模型 「什么时候该检索」

12毫秒暴露自动驾驶致命缺陷，北航新研究实现场景感知的动态物理对抗攻击｜TPAMI2025

DeepSeek、Gemini谁更能提供情感支持？趣丸×北大来了波情绪轨迹动态评估

NeurIPS 2025 | DynaAct：DeepSeek R1之外，探索大模型推理的另一条道路

老黄刚投的具身智能公司：三个华人创办

榨干GPU性能，中兴Mariana（马里亚纳）突破显存壁垒

让强化学习快如闪电：FlashRL一条命令实现极速Rollout，已全部开源

ICCV 2025 | 小红书AIGC团队提出图像和视频换脸新算法DynamicFace

无Tokenizer时代真要来了？Mamba作者再发颠覆性论文，挑战Transformer

动态RAG性能提升14个点！用4万亿token教会大模型「什么时候该检索」