AI资讯新闻榜单内容搜索-RL

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: RL
全球AI顶会NeurlPS开始收高中生论文了

全球AI顶会NeurlPS开始收高中生论文了

全球AI顶会NeurlPS开始收高中生论文了

培养 AI 人才,要从娃娃抓起,这句话似乎越来越不像开玩笑了。 本周五,顶级学术会议 NeurIPS 开设高中生论文 Track 的消息引爆了人工智能社区

来自主题: AI资讯
6830 点击    2024-04-14 14:46
抱抱脸Open了OpenAI的秘密武器,网易参与复现

抱抱脸Open了OpenAI的秘密武器,网易参与复现

抱抱脸Open了OpenAI的秘密武器,网易参与复现

OpenAI的秘密武器、ChatGPT背后功臣RLHF,被开源了。来自Hugging Face、加拿大蒙特利尔Mila研究所、网易伏羲AI Lab的研究人员从零开始复现了OpenAI的RLHF pipeline,罗列了25个关键实施细节。

来自主题: AI技术研报
4847 点击    2024-04-08 09:55
刚刚,Sora官方发布首支MV

刚刚,Sora官方发布首支MV

刚刚,Sora官方发布首支MV

AIGC,算是狠狠地震荡了一把音乐圈。就在刚刚,OpenAI官方账号发布的一支由Sora制作的MV(Music Video)——《Worldweight》,引发了不少网友们的围观。

来自主题: AI技术研报
8163 点击    2024-04-03 13:52
AI+下一代精准肿瘤学研究|Aignostics与拜耳共同创建新型靶点识别平台

AI+下一代精准肿瘤学研究|Aignostics与拜耳共同创建新型靶点识别平台

AI+下一代精准肿瘤学研究|Aignostics与拜耳共同创建新型靶点识别平台

2024年3月14日,拜耳与德国Aignostics GmbH宣布将就几项应用于精准肿瘤药物研发的人工智能方法展开战略合作。Aignostics是世界一流医院柏林夏里特大学(Charité-Universitätsmedizin Berlin)的衍生公司,也是利用计算病理学将复杂的生物医学数据转化为生物学见解的全球领先企业。

来自主题: AI资讯
5834 点击    2024-03-28 12:59
ICLR 2024 | RLHF有了通用平台和基准,天大开源,专攻现实决策场景

ICLR 2024 | RLHF有了通用平台和基准,天大开源,专攻现实决策场景

ICLR 2024 | RLHF有了通用平台和基准,天大开源,专攻现实决策场景

RLHF 通过学习人类偏好,能够在难以手工设计奖励函数的复杂决策任务中学习到正确的奖励引导,得到了很高的关注,在不同环境中选择合适的人类反馈类型和不同的学习方法至关重要

来自主题: AI技术研报
8487 点击    2024-03-28 09:59
模型偏好只与大小有关?上交大全面解析人类与32种大模型偏好的定量组分

模型偏好只与大小有关?上交大全面解析人类与32种大模型偏好的定量组分

模型偏好只与大小有关?上交大全面解析人类与32种大模型偏好的定量组分

在目前的模型训练范式中,偏好数据的的获取与使用已经成为了不可或缺的一环。在训练中,偏好数据通常被用作对齐(alignment)时的训练优化目标,如基于人类或 AI 反馈的强化学习(RLHF/RLAIF)或者直接偏好优化(DPO),而在模型评估中,由于任务的复杂性且通常没有标准答案,则通常直接以人类标注者或高性能大模型(LLM-as-a-Judge)的偏好标注作为评判标准。

来自主题: AI技术研报
10164 点击    2024-03-02 14:58
Sora创建病毒式视频全网疯转,OpenAI密谋推出TikTok竞品?专家猜测:这是计划的一部分

Sora创建病毒式视频全网疯转,OpenAI密谋推出TikTok竞品?专家猜测:这是计划的一部分

Sora创建病毒式视频全网疯转,OpenAI密谋推出TikTok竞品?专家猜测:这是计划的一部分

为何OpenAI只在TikTok上发布Sora新视频?AI专家猜测这是计划的一部分:创建病毒式视频、加水印、收集数据、添加RLHF、推出TikTok竞品……整套流程一气呵成。

来自主题: AI资讯
1594 点击    2024-02-23 14:38
人类偏好优化算法哪家强?跟着高手一文学懂DPO、IPO和KTO

人类偏好优化算法哪家强?跟着高手一文学懂DPO、IPO和KTO

人类偏好优化算法哪家强?跟着高手一文学懂DPO、IPO和KTO

尽管收集人类对模型生成内容的相对质量的标签,并通过强化学习从人类反馈(RLHF)来微调无监督大语言模型,使其符合这些偏好的方法极大地推动了对话式人工智能的发展。

来自主题: AI技术研报
7529 点击    2024-02-18 12:25