AI资讯新闻榜单内容搜索-模型训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型训练
用MoE横扫99个子任务!浙大等提出全新通用机器人策略GeRM

用MoE横扫99个子任务!浙大等提出全新通用机器人策略GeRM

用MoE横扫99个子任务!浙大等提出全新通用机器人策略GeRM

多任务机器人学习在应对多样化和复杂情景方面具有重要意义。然而,当前的方法受到性能问题和收集训练数据集的困难的限制

来自主题: AI技术研报
7416 点击    2024-04-17 18:16
脑电合成自然语音!LeCun转发Nature子刊新成果,代码开源

脑电合成自然语音!LeCun转发Nature子刊新成果,代码开源

脑电合成自然语音!LeCun转发Nature子刊新成果,代码开源

脑机接口最新进展登上Nature子刊,深度学习三巨头之一的LeCun都来转发。

来自主题: AI技术研报
8144 点击    2024-04-17 17:06
李飞飞团队年度报告揭底大模型训练成本:Gemini Ultra是GPT-4的2.5倍

李飞飞团队年度报告揭底大模型训练成本:Gemini Ultra是GPT-4的2.5倍

李飞飞团队年度报告揭底大模型训练成本:Gemini Ultra是GPT-4的2.5倍

如何复盘大模型技术爆发的这一年?除了直观的感受,你还需要一份系统的总结

来自主题: AI技术研报
5679 点击    2024-04-16 21:53
模型被投毒攻击,如今有了新的安全手段,还被AI顶刊接收

模型被投毒攻击,如今有了新的安全手段,还被AI顶刊接收

模型被投毒攻击,如今有了新的安全手段,还被AI顶刊接收

现今,机器学习(ML),更具体地说,深度学习已经改变了从金融到医疗等广泛的行业。在当前的 ML 范式中,训练数据首先被收集和策划,然后通过最小化训练数据上的某些损失标准来优化 ML 模型

来自主题: AI技术研报
6271 点击    2024-04-16 21:48
极长序列、极快速度:面向新一代高效大语言模型的LASP序列并行

极长序列、极快速度:面向新一代高效大语言模型的LASP序列并行

极长序列、极快速度:面向新一代高效大语言模型的LASP序列并行

从国际顶流 GPT-4 128K、Claude 200K 到国内「当红炸子鸡」支持 200 万字上下文的 Kimi Chat,大语言模型(LLM)在长上下文技术上不约而同地卷起来了

来自主题: AI技术研报
6406 点击    2024-04-16 18:08
还在卷长文本?谷歌最新论文直接把文本干到…无限长了

还在卷长文本?谷歌最新论文直接把文本干到…无限长了

还在卷长文本?谷歌最新论文直接把文本干到…无限长了

通过这项技术,能使transformer大模型在有限的计算资源 条件下,处理无限长度的输入。

来自主题: AI技术研报
6473 点击    2024-04-15 15:15
曾爆火的 InstantID又有了新玩法:风格化图像生成,已开源

曾爆火的 InstantID又有了新玩法:风格化图像生成,已开源

曾爆火的 InstantID又有了新玩法:风格化图像生成,已开源

风格化图像生成,也常称为风格迁移,其目标是生成与参考图像风格一致的图像。

来自主题: AI技术研报
5292 点击    2024-04-14 17:48