AI资讯新闻榜单内容搜索-周志华

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 周志华
周志华团队新作:LLM中存在奖励模型,首次理论证明RL对LLM有效性

周志华团队新作:LLM中存在奖励模型,首次理论证明RL对LLM有效性

周志华团队新作:LLM中存在奖励模型,首次理论证明RL对LLM有效性

将大语言模型(LLMs)与复杂的人类价值观对齐,仍然是 AI 面临的一个核心挑战。当前主要的方法是基于人类反馈的强化学习(RLHF)。该流程依赖于一个通过人类偏好训练的奖励模型来对模型输出进行评分,最终对齐后的 LLM 的质量在根本上取决于该奖励模型的质量。

来自主题: AI技术研报
7310 点击    2025-07-03 10:00
出手即王炸?照片级真实度生成式世界模型,还获得皮克斯和Jeff Dean投资

出手即王炸?照片级真实度生成式世界模型,还获得皮克斯和Jeff Dean投资

出手即王炸?照片级真实度生成式世界模型,还获得皮克斯和Jeff Dean投资

近段时间,世界模型的相关研究成果正如雨后春笋版不断涌现,光是我们报道过的就已有南大周志华团队的世界模型 Whale、Yann LeCun 团队的世界模型研究、李飞飞 World Labs 的空间智能研究、谷歌的强大世界模型 Genie 2 以及刚刚开源的像是能模拟万物的生成式物理引擎 Genesis。

来自主题: AI资讯
6993 点击    2024-12-20 16:14
大模型时代,南大周志华埋头做学件,最新论文上线

大模型时代,南大周志华埋头做学件,最新论文上线

大模型时代,南大周志华埋头做学件,最新论文上线

南京大学周志华教授提出的「学件」范式通过模型 + 规约的思路构建学件市场(现称学件基座系统),让用户根据需求从中统一地选择和部署模型。如今学件范式迎来了首个开源的基础平台 —— 北冥坞(Beimingwu)。

来自主题: AI技术研报
6892 点击    2024-01-30 13:51