AI资讯新闻榜单内容搜索-模型训练

LLM最大能力密度100天翻一倍！清华刘知远团队提出Densing Law

支持大模型一路狂飙的 Scaling Law 到头了？近期，AI 圈针对 Scaling Law 是否到头产生了分歧。一派观点认为 Scaling Law 已经「撞墙」了，另一派观点（如 OpenAI CEO Sam Altman）仍然坚定 Scaling Law 的潜力尚未穷尽。

来自主题: AI技术研报

8132 点击 2024-12-09 14:59

北京交通大学研究团队悄默声推出了一版o1，而且所有源代码、精选数据集以及衍生模型都开源！

来自主题: AI技术研报

9807 点击 2024-12-09 14:52

别说什么“没数据就去标注啊，没钱标注就别做大模型啊”这种风凉话，有些人数据不足也能做大模型，是因为有野心，就能想出来稀缺数据场景下的大模型解决方案，或者整理出本文将要介绍的 "Practical Guide to Fine-tuning with Limited Data" 这样的综述。

来自主题: AI资讯

11194 点击 2024-12-09 09:30

知识密集型工作也败了！大型语言模型在预测神经科学结果方面超越了人类专家，平均准确率达到81%，而人类专家仅为63%；模型通过整合大量文献数据，展现出了惊人的前瞻性预测能力，预示着未来科研工作中人机协作的巨大潜力。

来自主题: AI技术研报

8498 点击 2024-12-07 15:20

在人工智能发展史上，强化学习 (RL) 凭借其严谨的数学框架解决了众多复杂的决策问题，从围棋、国际象棋到机器人控制等领域都取得了突破性进展。

来自主题: AI技术研报

8723 点击 2024-12-07 15:11

人类离AGI究竟还有多远？最新一期Nature文章，从以往研究分析、多位大佬言论深入探讨了LLM在智能化道路上突破与局限。

来自主题: AI资讯

6901 点击 2024-12-07 15:07

以 GPT4V 为代表的多模态大模型（LMMs）在大语言模型（LLMs）上增加如同视觉的多感官技能，以实现更强的通用智能。虽然 LMMs 让人类更加接近创造智慧，但迄今为止，我们并不能理解自然与人工的多模态智能是如何产生的。

来自主题: AI技术研报

7919 点击 2024-12-07 15:02

近两年来，AI技术取得了重大发展。与此同时，对于使用版权内容进行AI模型训练争议不断，各国也都在积极探索适合自身的规制框架。

来自主题: AI资讯

12708 点击 2024-12-07 10:38

在 Minecraft 中构造一个能完成各种长序列任务的智能体，颇有挑战性。现有的工作利用大语言模型 / 多模态大模型生成行动规划，以提升智能体执行长序列任务的能力。

来自主题: AI技术研报

8129 点击 2024-12-06 17:58

目前，这一领域发展迅速，但现有综述多聚焦于单智能体的架构、特定能力或多智能体系统的某些方面，尚缺乏从个体到社会模拟的系统性回顾。因此，本文试图填补这一空白，为该领域提供全面的概述。

来自主题: AI技术研报

8414 点击 2024-12-06 17:55