AI资讯新闻榜单内容搜索-transforme

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: transforme

还在卷长文本？谷歌最新论文直接把文本干到…无限长了

还在卷长文本？谷歌最新论文直接把文本干到…无限长了

还在卷长文本？谷歌最新论文直接把文本干到…无限长了

通过这项技术，能使transformer大模型在有限的计算资源条件下，处理无限长度的输入。

来自主题: AI技术研报

6413 点击 2024-04-15 15:15

谷歌：假如AI大模型支持无限长上下文，会如何？

谷歌：假如AI大模型支持无限长上下文，会如何？

谷歌：假如AI大模型支持无限长上下文，会如何？

为解决大模型（LLMs）在处理超长输入序列时遇到的内存限制问题，本文作者提出了一种新型架构：Infini-Transformer，它可以在有限内存条件下，让基于Transformer的大语言模型（LLMs）高效处理无限长的输入序列。实验结果表明：Infini-Transformer在长上下文语言建模任务上超越了基线模型，内存最高可节约114倍。

来自主题: AI资讯

9264 点击 2024-04-14 11:32

谷歌爆改Transformer，“无限注意力”让1B小模型读完10部小说，114倍信息压缩

谷歌爆改Transformer，“无限注意力”让1B小模型读完10部小说，114倍信息压缩

谷歌爆改Transformer，“无限注意力”让1B小模型读完10部小说，114倍信息压缩

它通过将压缩记忆（compressive memory）整合到线性注意力机制中，用来处理无限长上下文

来自主题: AI资讯

9288 点击 2024-04-13 20:07

魔改RNN挑战Transformer，RWKV上新：推出2种新架构模型

魔改RNN挑战Transformer，RWKV上新：推出2种新架构模型

魔改RNN挑战Transformer，RWKV上新：推出2种新架构模型

不走Transformer寻常路，魔改RNN的国产新架构RWKV，有了新进展：提出了两种新的RWKV架构，即Eagle (RWKV-5) 和Finch（RWKV-6)。

来自主题: AI资讯

8897 点击 2024-04-13 18:06

直接扩展到无限长，谷歌Infini-Transformer终结上下文长度之争

直接扩展到无限长，谷歌Infini-Transformer终结上下文长度之争

直接扩展到无限长，谷歌Infini-Transformer终结上下文长度之争

谷歌又放大招了，发布下一代 Transformer 模型 Infini-Transformer。

来自主题: AI技术研报

10071 点击 2024-04-13 16:44

谷歌更新Transformer架构，更节省计算资源！50%性能提升

谷歌更新Transformer架构，更节省计算资源！50%性能提升

谷歌更新Transformer架构，更节省计算资源！50%性能提升

谷歌终于更新了Transformer架构。最新发布的Mixture-of-Depths（MoD），改变了以往Transformer计算模式。它通过动态分配大模型中的计算资源，跳过一些不必要计算，显著提高训练效率和推理速度。

来自主题: AI技术研报

7717 点击 2024-04-05 17:04

CVPR 2024满分论文，英伟达开源BOP排行榜6D物体姿态第一名方法

CVPR 2024满分论文，英伟达开源BOP排行榜6D物体姿态第一名方法

CVPR 2024满分论文，英伟达开源BOP排行榜6D物体姿态第一名方法

物体姿态估计对于各种应用至关重要，例如机器人操纵和混合现实。实例级方法通常需要纹理 CAD 模型来生成训练数据，并且不能应用于测试时未见过的新物体；而类别级方法消除了这些假设（实例训练和 CAD 模型），但获取类别级训练数据需要应用额外的姿态标准化和检查步骤。

来自主题: AI技术研报

7922 点击 2024-04-04 15:32

华为诺亚频域LLM「帝江」：仅需1/50训练成本，7B模型媲美LLaMA，推理加速5倍

华为诺亚频域LLM「帝江」：仅需1/50训练成本，7B模型媲美LLaMA，推理加速5倍

华为诺亚频域LLM「帝江」：仅需1/50训练成本，7B模型媲美LLaMA，推理加速5倍

基于 Transformer 架构的大语言模型在 NLP 领域取得了令人惊艳的效果，然而，Transformer 中自注意力带来的二次复杂度使得大模型的推理成本和内存占用十分巨大，特别是在长序列的场景中。

来自主题: AI技术研报

6086 点击 2024-04-03 17:29

扩散模型攻克算法难题，AGI不远了！谷歌大脑找到迷宫最短路径

扩散模型攻克算法难题，AGI不远了！谷歌大脑找到迷宫最短路径

扩散模型攻克算法难题，AGI不远了！谷歌大脑找到迷宫最短路径

解决最短路径算法，也能被扩散模型完成。

来自主题: AI技术研报

5969 点击 2024-04-02 17:18

此时此刻，两个Claude智能体正在无休止对话，无人干预

此时此刻，两个Claude智能体正在无休止对话，无人干预

此时此刻，两个Claude智能体正在无休止对话，无人干预

现在，AI 大模型已经疯狂到这种地步了吗？此时此刻，正有两个 Claude 模型在无休止地对话，它们在探索整个宇宙的奥妙。

来自主题: AI资讯

7891 点击 2024-03-31 14:59

上一页当前第32页,共41页下一页