AI资讯新闻榜单内容搜索-模型训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型训练
普林斯顿博士生高天宇指令微调进展速览:数据、算法和评估

普林斯顿博士生高天宇指令微调进展速览:数据、算法和评估

普林斯顿博士生高天宇指令微调进展速览:数据、算法和评估

自 ChatGPT 等大型语言模型推出以来,为了提升模型效果,各种指令微调方法陆续被提出。本文中,普林斯顿博士生、陈丹琦学生高天宇汇总了指令微调领域的进展,包括数据、算法和评估等。

来自主题: AI技术研报
7767 点击    2024-01-21 14:14
AI看视频自动找“高能时刻”|字节&中科院自动化所@AAAI 2024

AI看视频自动找“高能时刻”|字节&中科院自动化所@AAAI 2024

AI看视频自动找“高能时刻”|字节&中科院自动化所@AAAI 2024

字节跳动联合中科院自动化研究所提出新方法,用AI快速检测出视频中的高光片段,对输入视频的长度以及期望提取的高光长度都具有极高的灵活性,相关论文已被AAAI 2024收录。

来自主题: AI资讯
5521 点击    2024-01-21 14:02
AI“创作”的作品版权归谁?确权为时尚早

AI“创作”的作品版权归谁?确权为时尚早

AI“创作”的作品版权归谁?确权为时尚早

文章探讨了AI“创作”的作品版权归属问题,尤其关注大模型训练输入和创作输出两个环节的纠纷。作者提到了国内外的相关诉讼案例和不同国家对AI作品版权的态度。此外,科技公司在AI作品版权问题上的立场也存在差异。

来自主题: AI资讯
2869 点击    2024-01-18 08:43
蚂蚁集团开源新算法,可助大模型推理提速2-6倍

蚂蚁集团开源新算法,可助大模型推理提速2-6倍

蚂蚁集团开源新算法,可助大模型推理提速2-6倍

该算法现已在GitHub上开源,相关论文公布在ARXIV。近日,蚂蚁集团开源了一套新算法,可帮助大模型在推理时,提速2至6倍,引起业内关注。

来自主题: AI资讯
8566 点击    2024-01-17 14:08
性能大涨20%!中科大「状态序列频域预测」方法:表征学习样本效率max|NeurIPS 2023 Spotlight

性能大涨20%!中科大「状态序列频域预测」方法:表征学习样本效率max|NeurIPS 2023 Spotlight

性能大涨20%!中科大「状态序列频域预测」方法:表征学习样本效率max|NeurIPS 2023 Spotlight

SPF算法是一种基于状态序列频域预测的表征学习方法,利用状态序列的频域分布来显式提取状态序列数据中的趋势性和规律性信息,从而辅助表征高效地提取到长期未来信息。

来自主题: AI技术研报
9034 点击    2024-01-16 10:59
不要教一个AI学坏,因为它不会再学好

不要教一个AI学坏,因为它不会再学好

不要教一个AI学坏,因为它不会再学好

最近,AI初创公司Anthropic的研究表明,一旦LLM学会了人类教授的欺骗行为,它们就会在训练和评估的过程中隐藏自己,并在使用时偷偷输出恶意代码、注入漏洞。

来自主题: AI资讯
7859 点击    2024-01-16 10:06
拆掉英伟达护城河,细节曝光!世界最快超算用3072块AMD GPU训完超万亿参数LLM

拆掉英伟达护城河,细节曝光!世界最快超算用3072块AMD GPU训完超万亿参数LLM

拆掉英伟达护城河,细节曝光!世界最快超算用3072块AMD GPU训完超万亿参数LLM

世界上最快超算集群Frontier,用8%的GPU训练出了一个万亿级规模的大模型,而且是在AMD硬件平台之上完成。研究人员将训练的细节和克服的困难写成了一篇论文,展示了如何用非英伟达的生态完成大模型训练的技术框架和细节。

来自主题: AI资讯
6077 点击    2024-01-13 20:20
为大模型恶补数学,上交开源MathPile语料库,95亿tokens,还可商用

为大模型恶补数学,上交开源MathPile语料库,95亿tokens,还可商用

为大模型恶补数学,上交开源MathPile语料库,95亿tokens,还可商用

当前智能对话模型的发展中,强大的底层模型起着至关重要的作用。这些先进模型的预训练往往依赖于高质量且多样化的语料库,而如何构建这样的语料库,已成为行业中的一大挑战。

来自主题: AI资讯
3104 点击    2024-01-12 17:31