AI资讯新闻榜单内容搜索-模型训练

ChatGPT变笨新解释：世界被AI改变，与训练时不同了

对于ChatGPT变笨原因，学术界又有了一种新解释。加州大学圣克鲁兹分校一项研究指出：在训练数据截止之前的任务上，大模型表现明显更好。

来自主题: AI技术研报

4527 点击 2024-01-01 23:12

无需额外训练提升模型30%性能！DeepMind科学家点赞MIT博士生实习成果

一个来自MIT博士生的惊人发现：只需对Transformer的特定层进行一种非常简单的修剪，即可在缩小模型规模的同时显著提高模型性能。

来自主题: AI技术研报

1901 点击 2023-12-31 12:01

国产千卡千亿模型训练平台落地：70B到130B大模型训练，线性加速比达91%

国内首个以国产全功能GPU为底座的大规模算力集群，正式落地了！这便是来自摩尔线程的KUAE智算中心，全国产千卡千亿模型训练平台。

来自主题: AI资讯

10992 点击 2023-12-21 11:03

Gemini自曝中文用百度文心一言训练，网友看呆：大公司互薅羊毛？？

在谷歌Vertex AI平台使用该模型进行中文对话时，Gemini-Pro直接表示自己是百度语言大模型。

来自主题: AI资讯

4956 点击 2023-12-18 15:04

小模型如何进行上下文学习？字节跳动 & 华东师大联合提出自进化文本识别器

我们都知道，大语言模型（LLM）能够以一种无需模型微调的方式从少量示例中学习，这种方式被称为「上下文学习」（In-context Learning）。这种上下文学习现象目前只能在大模型上观察到。比如 GPT-4、Llama 等大模型在非常多的领域中都表现出了杰出的性能，但还是有很多场景受限于资源或者实时性要求较高，无法使用大模型。

来自主题: AI技术研报

5057 点击 2023-11-27 12:49

OpenAI宫斗中被忽略的一部分：AI对齐

本文探讨了AI对齐在OpenAI公司中被忽视的一部分，以及AI对齐在大模型训练中的重要性和影响。文章揭示了OpenAI内部因AI对齐而产生的分歧，并阐述了AI对齐在保证AI按照人类意图和价值观运作方面的作用。同时，文章指出AI对齐在大模型训练中存在的性能阉割和对齐税等问题，以及AI对齐在大模型发展中的隐藏模型和重要性。

来自主题: AI资讯

6290 点击 2023-11-23 20:29