AI资讯新闻榜单内容搜索-大语言模型

马斯克豪掷40亿购10万张H100训Grok 3！自曝Grok 2下月上线，巨额博弈剑指OpenAI

马斯克连回两条推文为xAI造势，宣布8月发布Grok 2，年底将推出在10万张H100上训练的Grok 3，芯片加持创新数据训练，打造对标GPT的新一代大语言模型。

来自主题: AI资讯

9815 点击 2024-07-03 16:19

当前大语言模型（LLM）的评估方法受到数据污染问题的影响，导致评估结果被高估，无法准确反映模型的真实能力。北京大学等提出的KIEval框架，通过知识基础的交互式评估，克服了数据污染的影响，更全面地评估了模型在知识理解和应用方面的能力。

来自主题: AI技术研报

5373 点击 2024-07-02 18:25

本文研究发现大语言模型在持续预训练过程中出现目标领域性能先下降再上升的现象。

来自主题: AI技术研报

8987 点击 2024-07-02 11:27

本文介绍了一篇语言模型对齐研究的论文，由瑞士、英国、和法国的三所大学的博士生和 Google DeepMind 以及 Google Research 的研究人员合作完成。

来自主题: AI技术研报

9191 点击 2024-07-01 15:17

计算机程序可以生成很像真随机的「伪随机数」，而LLM表示，干脆不装了，我就有自己最喜欢的数。

来自主题: AI技术研报

9246 点击 2024-06-28 16:37

本文关注OpenAI近期的两次收购，从这两次收购背后，试图拼起OpenAI设计“未来操作系统--LLMOS”的巨大蓝图。

来自主题: AI资讯

9516 点击 2024-06-28 15:48

大语言模型绝不会是通往AGI之路上的最后一个重大技术突破。

来自主题: AI资讯

7784 点击 2024-06-25 09:25

在人工智能领域的发展过程中，对大语言模型（LLM）的控制与指导始终是核心挑战之一，旨在确保这些模型既强大又安全地服务于人类社会。早期的努力集中于通过人类反馈的强化学习方法（RLHF）来管理这些模型，成效显著，标志着向更加人性化 AI 迈出的关键一步。

来自主题: AI技术研报

4278 点击 2024-06-23 19:39

大语言模型提示中，竟有不少「怪癖」：重复某些内容，准确性就大大提高；人名变匿名，准确性就大大下降。最近，马里兰OpenAI等机构的30多位研究者，首次对LLM的提示技术进行了大规模系统研究，并发布75页详尽报告。

来自主题: AI技术研报

8357 点击 2024-06-17 21:41

大语言模型（LLM）的迅速发展，引发了关于如何评估其公平性和可靠性的热议。

来自主题: AI技术研报

10084 点击 2024-06-17 19:37