AI资讯新闻榜单内容搜索-大模型对齐

仅需格式转换提升9%数学推理能力，上交开源新对齐方法ReAlign

大模型对齐新方法，让数学推理能力直接提升9%。

来自主题: AI技术研报

6996 点击 2024-03-13 11:10

有的大模型对齐方法包括基于示例的监督微调（SFT）和基于分数反馈的强化学习（RLHF）。然而，分数只能反应当前回复的好坏程度，并不能明确指出模型的不足之处。相较之下，我们人类通常是从语言反馈中学习并调整自己的行为模式。

来自主题: AI技术研报

7256 点击 2024-02-03 12:52

OPO 无需训练即可实现实时动态对齐，而且因其即插即用的特性，适用于所有的开源与闭源大模型。

来自主题: AI技术研报

9455 点击 2024-01-23 15:03

评估大模型对齐表现最高效的方式是？在生成式AI趋势里，让大模型回答和人类价值（意图）一致非常重要，也就是业内常说的对齐（Alignment）。

来自主题: AI技术研报

5944 点击 2023-11-13 21:49