AI资讯新闻榜单内容搜索-模型训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型训练
拆掉英伟达护城河,细节曝光!世界最快超算用3072块AMD GPU训完超万亿参数LLM

拆掉英伟达护城河,细节曝光!世界最快超算用3072块AMD GPU训完超万亿参数LLM

拆掉英伟达护城河,细节曝光!世界最快超算用3072块AMD GPU训完超万亿参数LLM

世界上最快超算集群Frontier,用8%的GPU训练出了一个万亿级规模的大模型,而且是在AMD硬件平台之上完成。研究人员将训练的细节和克服的困难写成了一篇论文,展示了如何用非英伟达的生态完成大模型训练的技术框架和细节。

来自主题: AI资讯
6433 点击    2024-01-13 20:20
为大模型恶补数学,上交开源MathPile语料库,95亿tokens,还可商用

为大模型恶补数学,上交开源MathPile语料库,95亿tokens,还可商用

为大模型恶补数学,上交开源MathPile语料库,95亿tokens,还可商用

当前智能对话模型的发展中,强大的底层模型起着至关重要的作用。这些先进模型的预训练往往依赖于高质量且多样化的语料库,而如何构建这样的语料库,已成为行业中的一大挑战。

来自主题: AI资讯
3520 点击    2024-01-12 17:31
谷歌MIT最新研究证明:高质量数据获取不难,大模型就是归途

谷歌MIT最新研究证明:高质量数据获取不难,大模型就是归途

谷歌MIT最新研究证明:高质量数据获取不难,大模型就是归途

数据获取最新解,便是从生成模型中学习。获取高质量数据,已经成为当前大模型训练的一大瓶颈。

来自主题: AI资讯
4785 点击    2024-01-12 14:19
单帧标注视频就能学到片段特征,达到全监督性能!华科拿下时序行为检测新SOTA|AAAI24

单帧标注视频就能学到片段特征,达到全监督性能!华科拿下时序行为检测新SOTA|AAAI24

单帧标注视频就能学到片段特征,达到全监督性能!华科拿下时序行为检测新SOTA|AAAI24

如何从一段视频中找出感兴趣的片段?时序行为检测(Temporal Action Localization,TAL)是一种常用方法。过去TAL中的建模是片段甚至实例级的,而现在只要视频里的一帧就能实现,效果媲美全监督。

来自主题: AI技术研报
8709 点击    2024-01-08 14:33
模型A:幸亏有你,我才不得0分,模型B:俺也一样

模型A:幸亏有你,我才不得0分,模型B:俺也一样

模型A:幸亏有你,我才不得0分,模型B:俺也一样

琳琅满目的乐高积木,通过一块又一块的叠加,可以创造出各种栩栩如生的人物、景观等,不同的乐高作品相互组合,又能为爱好者带来新的创意。

来自主题: AI技术研报
9106 点击    2024-01-06 16:37
大模型套壳祛魅

大模型套壳祛魅

大模型套壳祛魅

本文探讨了大模型套壳的问题,解释了大模型的内核和预训练过程。同时,介绍了“原创派”和“模仿派”两种预训练框架的差异,并讨论了通过“偷”聊天模型数据进行微调的现象。最后,提出了把“壳”做厚才是竞争力的观点。

来自主题: AI资讯
7911 点击    2024-01-04 09:53