AI资讯新闻榜单内容搜索-数据

Meta浙大校友让评估模型「自学成才」，数据全合成无需人工标注，训练Llama 3 70B超过405B

随着LLM不断迭代，偏好和评估数据中大量的人工标注逐渐成为模型扩展的显著障碍之一。Meta FAIR的团队最近提出了一种使用迭代式方法「自学成才」的评估模型训练方法，让70B参数的Llama-3-Instruct模型分数超过了Llama 3.1-405B。

来自主题: AI资讯

6203 点击 2024-08-26 09:52

统一transformer与diffusion！Meta融合新方法剑指下一代多模态王者

本文引入了 Transfusion，这是一种可以在离散和连续数据上训练多模态模型的方法。

来自主题: AI技术研报

11534 点击 2024-08-25 12:39

ECCV 2024 | 机器遗忘之后，扩散模型真正安全了吗？

在人工智能领域，图像生成技术一直是一个备受关注的话题。近年来，扩散模型（Diffusion Model）在生成逼真且复杂的图像方面取得了令人瞩目的进展。然而，技术的发展也引发了潜在的安全隐患，比如生成有害内容和侵犯数据版权。这不仅可能对用户造成困扰，还可能涉及法律和伦理问题。

来自主题: AI技术研报

10539 点击 2024-08-25 11:30

浅谈领域模型训练

这篇文章对如何进行领域模型训练进行一个简单的探讨，主要内容是对 post-pretrain 阶段进行分析，后续的 Alignment 阶段就先不提了，注意好老生常谈的“数据质量”和“数据多样性”即可。

来自主题: AI技术研报

11177 点击 2024-08-24 10:54

总说具身智能的数据太贵，鹏城实验室开源百万规模标准化数据集

今年以来，具身智能正在成为学术界和产业界的热门领域，相关的产品和成果层出不穷。

来自主题: AI技术研报

10678 点击 2024-08-23 18:04

明确了：文本数据中加点代码，训练出的大模型更强、更通用

代码知识原来这么重要。

来自主题: AI技术研报

11477 点击 2024-08-23 17:18

LLM蒸馏到GNN，性能提升6.2%！Emory提出大模型蒸馏到文本图｜CIKM 2024

Emory大学的研究团队提出了一种创新的方法，将大语言模型（LLM）在文本图（Text-Attributed Graph, 缩写为TAG）学习中的强大能力蒸馏到本地模型中，以应对文本图学习中的数据稀缺、隐私保护和成本问题。通过训练一个解释器模型来理解LLM的推理过程，并对学生模型进行对齐优化，在多个数据集上实现了显著的性能提升，平均提高了6.2%。

来自主题: AI技术研报

12120 点击 2024-08-23 16:35