AI资讯新闻榜单内容搜索-对齐

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 对齐
GPT-4批评GPT-4实现「自我提升」!OpenAI前超级对齐团队又一力作被公开

GPT-4批评GPT-4实现「自我提升」!OpenAI前超级对齐团队又一力作被公开

GPT-4批评GPT-4实现「自我提升」!OpenAI前超级对齐团队又一力作被公开

今天,OpenAI悄悄在博客上发布了一篇新论文——CriticGPT,而这也是前任超级对齐团队的「遗作」之一。CriticGPT同样基于GPT-4训练,但目的却是用来指正GPT-4的输出错误,实现「自我批评」。

来自主题: AI资讯
8960 点击    2024-06-28 16:07
从RLHF到DPO再到TDPO,大模型对齐算法已经是「token-level」

从RLHF到DPO再到TDPO,大模型对齐算法已经是「token-level」

从RLHF到DPO再到TDPO,大模型对齐算法已经是「token-level」

在人工智能领域的发展过程中,对大语言模型(LLM)的控制与指导始终是核心挑战之一,旨在确保这些模型既强大又安全地服务于人类社会。早期的努力集中于通过人类反馈的强化学习方法(RLHF)来管理这些模型,成效显著,标志着向更加人性化 AI 迈出的关键一步。

来自主题: AI技术研报
3792 点击    2024-06-23 19:39
零成本突破多模态大模型瓶颈!多所美国顶尖高校华人团队,联合推出自增强技术CSR

零成本突破多模态大模型瓶颈!多所美国顶尖高校华人团队,联合推出自增强技术CSR

零成本突破多模态大模型瓶颈!多所美国顶尖高校华人团队,联合推出自增强技术CSR

现有多模态大模型在对齐不同模态时面临幻觉和细粒度感知不足等问题,传统偏好学习方法依赖可能不适配的外源数据,存在成本和质量问题。Calibrated Self-Rewarding(CSR)框架通过自我增强学习,利用模型自身输出构造更可靠的偏好数据,结合视觉约束提高学习效率和准确性。

来自主题: AI技术研报
6490 点击    2024-06-21 14:05
字节豆包、武大提出 CAL:通过视觉相关的 token 增强多模态对齐效果

字节豆包、武大提出 CAL:通过视觉相关的 token 增强多模态对齐效果

字节豆包、武大提出 CAL:通过视觉相关的 token 增强多模态对齐效果

当前主流的视觉语言模型(VLM)主要基于大语言模型(LLM)进一步微调。因此需要通过各种方式将图像映射到 LLM 的嵌入空间,然后使用自回归方式根据图像 token 预测答案。

来自主题: AI技术研报
8426 点击    2024-06-17 19:35
赶走Ilya迎来前陆军上将,OpenAI官宣董事会「安全团队」新成员

赶走Ilya迎来前陆军上将,OpenAI官宣董事会「安全团队」新成员

赶走Ilya迎来前陆军上将,OpenAI官宣董事会「安全团队」新成员

「超级对齐」团队集体出走后,OpenAI最近正在频繁招聘,但不是技术团队,而是高管。前有CFO走马上任,今天又有一个退役的陆军上将成为董事会新成员。

来自主题: AI资讯
8393 点击    2024-06-15 16:17
OpenAI公开破解GPT-4思维的新方法,Ilya也参与了!

OpenAI公开破解GPT-4思维的新方法,Ilya也参与了!

OpenAI公开破解GPT-4思维的新方法,Ilya也参与了!

OpenAI研究如何破解GPT-4思维,公开超级对齐团队工作,Ilya Sutskever也在作者名单之列。

来自主题: AI技术研报
8401 点击    2024-06-08 12:07
OpenAI新作署名Ilya,提取1600万个特征看透GPT-4大脑!

OpenAI新作署名Ilya,提取1600万个特征看透GPT-4大脑!

OpenAI新作署名Ilya,提取1600万个特征看透GPT-4大脑!

今天,OpenAI发布了一篇GPT-4可解释性的论文,似乎是作为前两天员工联名信的回应。网友细看论文才发现,这居然是已经解散的「超级对齐」团队的「最后之作」。

来自主题: AI技术研报
8425 点击    2024-06-08 11:50