AI资讯新闻榜单内容搜索-周志华

南大周志华团队最新力作：一个算法通吃所有，在线学习迎来新范式？

世界是动态变化的。为了理解这个动态变化的世界并在其中运行，AI 模型必须具备在线学习能力。为此，该领域提出了一种新的性能指标 —— 适应性遗憾值（adaptive regret），其定义为任意区间内的最大静态遗憾值。

来自主题: AI技术研报

6818 点击 2025-08-05 16:29

周志华团队新作：LLM中存在奖励模型，首次理论证明RL对LLM有效性

将大语言模型（LLMs）与复杂的人类价值观对齐，仍然是 AI 面临的一个核心挑战。当前主要的方法是基于人类反馈的强化学习（RLHF）。该流程依赖于一个通过人类偏好训练的奖励模型来对模型输出进行评分，最终对齐后的 LLM 的质量在根本上取决于该奖励模型的质量。

来自主题: AI技术研报

9295 点击 2025-07-03 10:00

南大周志华：百万模型进入学件基座系统，很多我们没预期过的事也有可能实现

大模型时代，全世界AI从业者追赶OpenAI GPT系列的脚步仍未停歇，但也有人，坚持深耕在国产原创的另一条大模型之路上。

来自主题: AI技术研报

5359 点击 2024-12-30 09:59

出手即王炸？照片级真实度生成式世界模型，还获得皮克斯和Jeff Dean投资

近段时间，世界模型的相关研究成果正如雨后春笋版不断涌现，光是我们报道过的就已有南大周志华团队的世界模型 Whale、Yann LeCun 团队的世界模型研究、李飞飞 World Labs 的空间智能研究、谷歌的强大世界模型 Genie 2 以及刚刚开源的像是能模拟万物的生成式物理引擎 Genesis。

来自主题: AI资讯

8753 点击 2024-12-20 16:14