AI资讯新闻榜单内容搜索-模型训练

大就是好：前沿大模型盘点

人工智能的能力会在未来几年内得到显著提升

来自主题: AI资讯

6932 点击 2024-09-30 13:22

迈向多语言医疗大模型：大规模预训练语料、开源模型与全面基准测试

在医疗领域中，大语言模型已经有了广泛的研究。然而，这些进展主要依赖于英语的基座模型，并受制于缺乏多语言医疗专业数据的限制，导致当前的医疗大模型在处理非英语问题时效果不佳。

来自主题: AI技术研报

9865 点击 2024-09-29 22:38

Ilya预言错了！华人Nature一作给RLHF「判死刑」，全球大模型都不可靠

2022年，AI大牛Ilya Sutskever曾预测：「随着时间推移，人类预期和AI实际表现差异可能会缩小」。

来自主题: AI资讯

4748 点击 2024-09-29 16:18

利用公开知识定向提升大模型，腾讯优图&上交大提出新方法，性能达SOTA

告别传统指令微调，大模型特定任务性能提升有新方法了。一种新型开源增强知识框架，可以从公开数据中自动提取相关知识，针对性提升任务性能。与基线和SOTA方法对比，本文方法在各项任务上均取得了更好的性能。

来自主题: AI资讯

4760 点击 2024-09-29 15:59

从数据增强的隐藏作用出发，揭示视觉强化学习可塑性损失的独特机制

Sutton 等研究人员近期在《Nature》上发表的研究《Loss of Plasticity in Deep Continual Learning》揭示了一个重要发现：在持续学习环境中，标准深度学习方法的表现竟不及浅层网络。研究指出，这一现象的主要原因是 "可塑性损失"（Plasticity Loss）：深度神经网络在面对非平稳的训练目标持续更新时，会逐渐丧失从新数据中学习的能力。

来自主题: AI资讯

5717 点击 2024-09-29 14:39