AI资讯新闻榜单内容搜索-人工智

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 人工智
周志华团队新作:LLM中存在奖励模型,首次理论证明RL对LLM有效性

周志华团队新作:LLM中存在奖励模型,首次理论证明RL对LLM有效性

周志华团队新作:LLM中存在奖励模型,首次理论证明RL对LLM有效性

将大语言模型(LLMs)与复杂的人类价值观对齐,仍然是 AI 面临的一个核心挑战。当前主要的方法是基于人类反馈的强化学习(RLHF)。该流程依赖于一个通过人类偏好训练的奖励模型来对模型输出进行评分,最终对齐后的 LLM 的质量在根本上取决于该奖励模型的质量。

来自主题: AI技术研报
7287 点击    2025-07-03 10:00
AI训练版权重大判决:合法扫描可接受,盗版下载仍侵权

AI训练版权重大判决:合法扫描可接受,盗版下载仍侵权

AI训练版权重大判决:合法扫描可接受,盗版下载仍侵权

美国加州两起判决首次认定:AI公司扫描购买的正版书籍用于模型训练属合理使用,训练行为具变革性也属合理使用,但盗版素材获取仍侵权。中美监管宽松利于AI产业发展,欧盟严格规定要求素材许可或提供退出选项。AI输出侵权内容或诱导输出训练素材存在争议。

来自主题: AI资讯
7585 点击    2025-07-03 08:58
Grok 4源代码刚刚泄露!上线倒计时,马斯克xAI估值破1130亿,大模型要变天

Grok 4源代码刚刚泄露!上线倒计时,马斯克xAI估值破1130亿,大模型要变天

Grok 4源代码刚刚泄露!上线倒计时,马斯克xAI估值破1130亿,大模型要变天

就在刚刚,xAI再获百亿美元融资,估值飙至1130亿。而xAI控制台中,已有源代码流出,Grok 4和Grok 4 Code即将上线!现在,全网都在搓手以待,Grok 4的诞生,将怎样搅动当前顶尖大模型的局面。

来自主题: AI资讯
7781 点击    2025-07-02 17:43
智谱没跟上OpenAI

智谱没跟上OpenAI

智谱没跟上OpenAI

“中国版OpenAI”智谱,意外被OpenAI点了次名。

来自主题: AI资讯
8156 点击    2025-07-02 17:19
AI挤占人类音乐,如何反制?

AI挤占人类音乐,如何反制?

AI挤占人类音乐,如何反制?

AI开始挤占人类音乐了。今年1月,法国音乐流媒体服务Deezer曾透露,该平台新上传内容有10%完全由AI生成,两个月来,比例提高到了18%。“而且我们看不到任何放缓的迹象。”

来自主题: AI资讯
6688 点击    2025-07-02 17:14
同时监督和强化的单阶段大模型微调,告别“先背书再刷题”,推理泛化双提升|中科院&美团等

同时监督和强化的单阶段大模型微调,告别“先背书再刷题”,推理泛化双提升|中科院&美团等

同时监督和强化的单阶段大模型微调,告别“先背书再刷题”,推理泛化双提升|中科院&美团等

通过单阶段监督微调与强化微调结合,让大模型在训练时能同时利用专家演示和自我探索试错,有效提升大模型推理性能。

来自主题: AI技术研报
5894 点击    2025-07-02 15:35