AI资讯新闻榜单内容搜索-transforme

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: transforme
2024年中国AI基础数据服务研究报告

2024年中国AI基础数据服务研究报告

2024年中国AI基础数据服务研究报告

近年来,Transformer等预训练大模型在语言理解及生成等领域表现出色,大模型背后的Scaling Law(规模定律)进一步揭示了模型性能与数据量、算力之间的关系,强化了数据在提升AI表现中的关键作用。

来自主题: AI资讯
5512 点击    2024-09-03 10:04
Mamba作者新作:将Llama3蒸馏成混合线性 RNN

Mamba作者新作:将Llama3蒸馏成混合线性 RNN

Mamba作者新作:将Llama3蒸馏成混合线性 RNN

Transformer 在深度学习领域取得巨大成功的关键是注意力机制。注意力机制让基于 Transformer 的模型关注与输入序列相关的部分,实现了更好的上下文理解。然而,注意力机制的缺点是计算开销大,会随输入规模而二次增长,Transformer 也因此难以处理非常长的文本。

来自主题: AI技术研报
7481 点击    2024-08-31 14:54
从拨号上网到创立估值55亿美元独角兽,Transformer作者万字访谈聊AI趋势

从拨号上网到创立估值55亿美元独角兽,Transformer作者万字访谈聊AI趋势

从拨号上网到创立估值55亿美元独角兽,Transformer作者万字访谈聊AI趋势

除了扩大模型规模,AI 公司还有其他路可以走吗?只靠模型 API 赚不到钱了怎么办?Aidan Gomez 在访谈中谈到了目前困扰 AI 公司的诸多难题。

来自主题: AI资讯
9286 点击    2024-08-25 11:18
Transformer作者预警:只卖模型玩不过OpenAI!

Transformer作者预警:只卖模型玩不过OpenAI!

Transformer作者预警:只卖模型玩不过OpenAI!

Transformer八子中最年轻的Aidan Gomez在最新的采访中感叹:

来自主题: AI资讯
6596 点击    2024-08-24 16:24
语言图像模型大一统!Meta将Transformer和Diffusion融合,多模态AI王者登场

语言图像模型大一统!Meta将Transformer和Diffusion融合,多模态AI王者登场

语言图像模型大一统!Meta将Transformer和Diffusion融合,多模态AI王者登场

就在刚刚,Meta最新发布的Transfusion,能够训练生成文本和图像的统一模型了!完美融合Transformer和扩散领域之后,语言模型和图像大一统,又近了一步。也就是说,真正的多模态AI模型,可能很快就要来了!

来自主题: AI技术研报
9516 点击    2024-08-24 16:04
Transformer核心作者重返谷歌,任Gemini联合技术负责人!联手Jeff Dean追赶竞敌

Transformer核心作者重返谷歌,任Gemini联合技术负责人!联手Jeff Dean追赶竞敌

Transformer核心作者重返谷歌,任Gemini联合技术负责人!联手Jeff Dean追赶竞敌

被谷歌买下的AI独角兽Character.AI,已与团队深度融合。Transformer核心作者、创始人之一Noam Shazeer将担任Gemini联合技术负责人,与Jeff Dean和Oriol Vinyals平起平坐。

来自主题: AI技术研报
9139 点击    2024-08-24 10:50
Jamba 1.5发布,最长上下文,非Transformer架构首次成功领先

Jamba 1.5发布,最长上下文,非Transformer架构首次成功领先

Jamba 1.5发布,最长上下文,非Transformer架构首次成功领先

Jamba是第一个基于 Mamba 架构的生产级模型。Mamba 是由卡内基梅隆大学和普林斯顿大学的研究人员提出的新架构,被视为 Transformer 架构的有力挑战者。

来自主题: AI资讯
7820 点击    2024-08-24 10:07