AI资讯新闻榜单内容搜索-transforme

清华提出时间序列大模型：面向通用时序分析的生成式Transformer | ICML 2024

大模型在语言、图像领域取得了巨大成功，时间序列作为多个行业的重要数据类型，时序领域的大模型构建尚处于起步阶段。近期，清华大学的研究团队基于Transformer在大规模时间序列上进行生成式预训练，获得了任务通用的时序分析模型，展现出大模型特有的泛化性与可扩展性

来自主题: AI技术研报

12523 点击 2024-07-19 12:31

好家伙！为了揭秘Transformer内部工作原理，陈丹琦团队直接复现——

来自主题: AI技术研报

11537 点击 2024-07-18 16:37

“欧洲OpenAI”和“Transformer挑战者”强强联合了！

来自主题: AI资讯

12174 点击 2024-07-17 19:09

把因果链展示给 LLM，它就能学会公理。

来自主题: AI技术研报

10038 点击 2024-07-16 19:53

来自微软、MIT等机构的学者提出了一种创新的训练范式，攻破了大模型的推理缺陷。他们通过因果模型构建数据集，直接教模型学习公理，结果只有67M参数的微型Transformer竟能媲美GPT-4的推理能力。

来自主题: AI技术研报

10350 点击 2024-07-14 13:52

Mamba模型由于匹敌Transformer的巨大潜力，在推出半年多的时间内引起了巨大关注。但在大规模预训练的场景下，这两个架构还未有「一较高低」的机会。最近，英伟达、CMU、普林斯顿等机构联合发表的实证研究论文填补了这个空白。

来自主题: AI技术研报

5628 点击 2024-07-13 19:32

自从大型 Transformer 模型逐渐成为各个领域的统一架构，微调就成为了将预训练大模型应用到下游任务的重要手段

来自主题: AI技术研报

11636 点击 2024-07-12 17:47

生成式模型原本被设计来模仿人类的各种复杂行为，但人们普遍认为它们最多只能达到与其训练数据中的专家相当的水平。不过，最新的研究突破了这一限制，表明在特定领域，如国际象棋，通过采用低温采样技术，这些模型能够超越它们所学习的那些专家，展现出更高的能力。

来自主题: AI技术研报

10828 点击 2024-07-12 17:18

释放进一步扩展 Transformer 的潜力，同时还可以保持计算效率。

来自主题: AI技术研报

10963 点击 2024-07-10 18:39

神经网络拟合数据的能力受哪些因素影响？CNN一定比Transformer差吗？ReLU和SGD还有哪些神奇的作用？近日，LeCun参与的一项工作向我们展示了神经网络在实践中的灵活性。

来自主题: AI技术研报

10341 点击 2024-07-10 18:23