AI资讯新闻榜单内容搜索-模型训练

扩散模型也能搞定社交信息推荐，港大数据智能实验室提出RecDiff

用扩散模型搞社交信息推荐，怎么解决数据噪声难题？现有的一些自监督学习方法效果还是有限。

来自主题: AI技术研报

9729 点击 2024-07-29 19:58

上海交通大学温颖教授：打造“通才”Agent｜Agent Insights

解决问题：语言智能体的动作通常由 Token（令牌，语言模型中表示单词/短语/汉字的最小符号单元）序列组成，直接将强化学习用于语言智能体进行策略优化的过程中，一般需要预定义可行动作集合，同时忽略了动作内 Token 细粒度信用分配问题，团队将 Agent 优化从动作层分解到 Token 层，为每个动作内 Token 提供更精细的监督，可在语言动作空间不受约束的环境中实现可控优化复杂度

来自主题: AI资讯

4133 点击 2024-07-29 17:50

训练一次经历 419 次意外故障，英伟达 GPU 也差点玩不转 405B 模型，全靠 Meta 工程师后天救场

一半以上的故障都归因于 GPU 及其高带宽内存。

来自主题: AI资讯

6549 点击 2024-07-29 17:47

FBI-LLM低比特基础大语言模型来了，首个完全从头训练的二值化语言模型

自回归训练方式已经成为了大语言模型（LLMs）训练的标准模式，今天介绍一篇来自阿联酋世界第一所人工智能大学MBZUAI的VILA实验室和CMU计算机系合作的论文，题为《FBI-LLM: Scaling Up Fully Binarized LLMs from Scratch via Autoregressive Distillation》

来自主题: AI技术研报

8442 点击 2024-07-28 23:25