
不是RNN的锅!清华团队深入分析长上下文建模中的状态崩溃,Mamba作者点赞
不是RNN的锅!清华团队深入分析长上下文建模中的状态崩溃,Mamba作者点赞RNN模型在长上下文中表现不佳?近日,来自清华的研究团队对此进行了深入的实验分析,结果表明:不是RNN的锅。
来自主题: AI技术研报
8413 点击 2024-11-27 17:10
RNN模型在长上下文中表现不佳?近日,来自清华的研究团队对此进行了深入的实验分析,结果表明:不是RNN的锅。
大模型内卷时代,也不断有人跳出来挑战Transformer的统治地位,RWKV最新发布的Eagle 7B模型登顶了多语言基准测试,同时成本降低了数十倍