AI资讯新闻榜单内容搜索-模型训练

为多模态LLM引入ControlNet理念，开源插件解决灾难性遗忘 | AAAI

多模态大模型内嵌语言模型总是出现灾难性遗忘怎么办？

来自主题: AI技术研报

8637 点击 2024-12-17 16:35

近日，谷歌DeepMind的研究人员推出了苏格拉底式学习，在没有外部数据的情况下，让AI通过语言游戏不断变强。

来自主题: AI技术研报

7753 点击 2024-12-17 14:40

PCNet网络具有创新的协同采样算子和优化的重建网络，实验结果证明，其在图像重建精度、计算效率和任务扩展性方面均优于现有方法，为高分辨率图像的压缩感知提供了新的解决方案。

来自主题: AI技术研报

8013 点击 2024-12-17 14:35

Ilya「预训练结束了」言论一出，圈内哗然。谷歌大佬Logan Klipatrick和LeCun站出来反对说：预训练还没结束！Scaling Law真的崩了吗？Epoch AI发布报告称，我们已经进入「小模型」周期，但下一代依然会更大。

来自主题: AI资讯

8614 点击 2024-12-17 10:02

MAPLE实验室提出通过强化学习优化图像生成模型的去噪过程，使其能以更少的步骤生成高质量图像，在多个图像生成模型上实现了减少推理步骤，还能提高图像质量。

来自主题: AI技术研报

7467 点击 2024-12-17 09:54

Scaling Law不仅在放缓，而且不一定总是适用！尤其在文本分类任务中，扩大训练集的数据量可能会带来更严重的数据冲突和数据冗余。

来自主题: AI技术研报

7339 点击 2024-12-16 09:43

本文介绍了首个多模态大模型（MLLM）可解释性综述

来自主题: AI技术研报

8399 点击 2024-12-15 19:25

ACM SIGKDD（简称 KDD）始于 1989 年，是全球数据挖掘领域历史最悠久、规模最大的国际顶级学术会议。KDD 2025 将于 2025 年 8 月 3 日在加拿大多伦多举办。

来自主题: AI技术研报

7752 点击 2024-12-14 14:00

大语言模型（LLMs）通过更多的推理展现出了更强的能力和可靠性，从思维链提示发展到了 OpenAI-o1 这样具有较强推理能力的模型。

来自主题: AI技术研报

6588 点击 2024-12-13 14:40

Transformer模型自2017年问世以来，已成为AI领域的核心技术，尤其在自然语言处理中占据主导地位。然而，关于其核心机制“注意力”的起源，学界存在争议，一些学者如Jürgen Schmidhuber主张自己更早提出了相关概念。

来自主题: AI技术研报

7512 点击 2024-12-13 14:24