AI资讯新闻榜单内容搜索-模型训练

开闭源模型「大乱斗」：看看哪个智能体最能窥见人类真实意图

在人工智能迅猛发展的今天，我们不断探索着机器的智能化，但却往往忽视了这些智能体如何深层地理解我们 —— 它们的创造者。

来自主题: AI资讯

5140 点击 2024-08-10 18:14

混合专家，也得术业有专攻。

来自主题: AI资讯

5648 点击 2024-08-10 18:09

用 FlexAttention 尝试一种新的注意力模式。

来自主题: AI资讯

9731 点击 2024-08-10 18:05

多模态大语言模型 (Multimodal Large Language Moodel, MLLM) 以其强大的语言理解能力和生成能力，在各个领域取得了巨大成功。

来自主题: AI资讯

7882 点击 2024-08-10 12:03

LLM数学水平不及小学生怎么办？CMU清华团队提出了Lean-STaR训练框架，在语言模型进行推理的每一步中都植入CoT，提升了模型的定理证明能力，成为miniF2F上的新SOTA。

来自主题: AI技术研报

7797 点击 2024-08-10 11:45

RLHF到底是不是强化学习？最近，AI大佬圈因为这个讨论炸锅了。和LeCun同为质疑派的Karpathy表示：比起那种让AlphaGo在围棋中击败人类的强化学习，RLHF还差得远呢。

来自主题: AI资讯

7960 点击 2024-08-10 10:32

假如你目前正在使用和研究类似CAMEL的多智能体系统，现在已经有了扮演研究者的Agent和负责写论文的Agent，再添加一个事实核查Agent会改善结果吗？

来自主题: AI资讯

5561 点击 2024-08-09 20:44

前段时间冲上热搜的问题「9.11比9.9大吗？」，让几乎所有LLM集体翻车。看似热度已过，但AI界大佬Andrej Karpathy却从中看出了当前大模型技术的本质缺陷，以及未来的潜在改进方向。

来自主题: AI技术研报

9935 点击 2024-08-09 14:38

用光训练神经网络，清华成果最新登上了Nature！

来自主题: AI技术研报

11226 点击 2024-08-09 13:57

GPT-4o的怪癖暴露了，还是被官方公开的！

来自主题: AI资讯

10099 点击 2024-08-09 13:36