AI资讯新闻榜单内容搜索-模型训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型训练
这篇论文非常火!差分Transformer竟能消除注意力噪声,犹如降噪耳机

这篇论文非常火!差分Transformer竟能消除注意力噪声,犹如降噪耳机

这篇论文非常火!差分Transformer竟能消除注意力噪声,犹如降噪耳机

Transformer 的强大实力已经在诸多大型语言模型(LLM)上得到了证明,但该架构远非完美,也有很多研究者致力于改进这一架构,比如机器之心曾报道过的 Reformer 和 Infini-Transformer。

来自主题: AI技术研报
7144 点击    2024-10-10 12:15
开发者火冒三丈炮轰GenAI:垃圾语料太多,模型正在变得越来越笨

开发者火冒三丈炮轰GenAI:垃圾语料太多,模型正在变得越来越笨

开发者火冒三丈炮轰GenAI:垃圾语料太多,模型正在变得越来越笨

生成式AI(GenAI),尤其是以OpenAI的ChatGPT为代表,人们发现,这些大模型在一年多后的性能表现远不及刚发布时那样令人惊艳了。

来自主题: AI资讯
4415 点击    2024-10-08 18:59
「乘法变加法」!MIT清华校友全新方法优化Transformer:Addition is All You Need

「乘法变加法」!MIT清华校友全新方法优化Transformer:Addition is All You Need

「乘法变加法」!MIT清华校友全新方法优化Transformer:Addition is All You Need

Transformer计算,竟然直接优化到乘法运算了。MIT两位华人学者近期发表的一篇论文提出:Addition is All You Need,让LLM的能耗最高降低95%。

来自主题: AI技术研报
4745 点击    2024-10-08 17:32
做语料交易平台,Cloudflare要为站长“主持公道”

做语料交易平台,Cloudflare要为站长“主持公道”

做语料交易平台,Cloudflare要为站长“主持公道”

这样一套组合拳打下去,AI厂商大概率就会乖乖向网站付费了。

来自主题: AI资讯
6564 点击    2024-10-08 17:18
ECCV2024 Oral | 第一视角下的动作图像生成,Meta等提出LEGO模型

ECCV2024 Oral | 第一视角下的动作图像生成,Meta等提出LEGO模型

ECCV2024 Oral | 第一视角下的动作图像生成,Meta等提出LEGO模型

如何基于用户的问题和当前场景的照片,生成同一场景下的第一视角的动作图像,从而更准确地指导用户执行下一步行动?

来自主题: AI资讯
4510 点击    2024-10-02 11:22
mini-GPT4o来了? 能看、能听、会说,还情感丰富的多模态全能助手EMOVA

mini-GPT4o来了? 能看、能听、会说,还情感丰富的多模态全能助手EMOVA

mini-GPT4o来了? 能看、能听、会说,还情感丰富的多模态全能助手EMOVA

EMOVA(EMotionally Omni-present Voice Assistant),一个能够同时处理图像、文本和语音模态,能看、能听、会说的多模态全能助手,并通过情感控制,拥有更加人性化的交流能力。

来自主题: AI资讯
4613 点击    2024-10-02 11:17
一手训练,多手应用:国防科大提出灵巧手抓取策略迁移新方案

一手训练,多手应用:国防科大提出灵巧手抓取策略迁移新方案

一手训练,多手应用:国防科大提出灵巧手抓取策略迁移新方案

在机器人研究领域,抓取任务始终是机器人操作中的一个关键问题。这项任务的核心目标是控制机械手移动到合适位置,并完成对物体的抓取。近年来,基于学习的方法在提高对不同物体的抓取的泛化能力上取得了显著进展,但针对机械手本身,尤其是复杂的灵巧手(多指机械手)之间的泛化能力仍然缺乏深入研究。由于灵巧手在不同形态和几何结构上存在显著差异,抓取策略的跨手转移一直存在挑战。

来自主题: AI技术研报
10194 点击    2024-10-01 14:31