
免训练加速61倍!陈怡然团队新作DPad:仅关注「彩票token」
免训练加速61倍!陈怡然团队新作DPad:仅关注「彩票token」杜克大学团队发现,扩散大语言模型只需关注少量「中奖」token,就能在推理时把速度提升61-97倍,还能让模型更懂格式、更听话。新策略DPad不训练也能零成本挑出关键信息,实现「少算多准」的双赢。
来自主题: AI技术研报
6595 点击 2025-09-28 09:51
杜克大学团队发现,扩散大语言模型只需关注少量「中奖」token,就能在推理时把速度提升61-97倍,还能让模型更懂格式、更听话。新策略DPad不训练也能零成本挑出关键信息,实现「少算多准」的双赢。
复杂的神经网络被 AI 揭开。