AI资讯新闻榜单内容搜索-LLM

盛名一时的BERT哪去了？这个问题的答案昭示了LLM范式的转变

编码器模型哪去了？如果 BERT 效果好，那为什么不扩展它？编码器 - 解码器或仅编码器模型怎么样了？

来自主题: AI资讯

9933 点击 2024-07-22 14:50

ICML 2024 Oral | DPO是否比PPO更适合LLM，清华吴翼团队最新揭秘

如何让大模型更好的遵从人类指令和意图？如何让大模型有更好的推理能力？如何让大模型避免幻觉？能否解决这些问题，是让大模型真正广泛可用，甚至实现超级智能（Super Intelligence）最为关键的技术挑战。这些最困难的挑战也是吴翼团队长期以来的研究重点，大模型对齐技术（Alignment）所要攻克的难题。

来自主题: AI资讯

12474 点击 2024-07-21 17:10

前谷歌科学家Yi Tay「LLM演义」系列博客第一弹：BERT为何匿迹江湖？

前谷歌科学家Yi Tay重磅推出「LLM时代的模型架构」系列博客，首篇博文的话题关于：基于encoder-only架构的BERT是如何被基于encoder-decoder架构的T5所取代的，分析了BERT灭绝的始末以及不同架构模型的优缺点，以史为鉴，对于未来的创新具有重要意义。

来自主题: AI技术研报

11460 点击 2024-07-21 16:58

使用视觉语言模型进行 PDF 检索 [译]

近年来，随着大语言模型 (LLM) 的发展，构建检索增强生成 (RAG) 解决方案成为了一个热门话题。RAG 将 LLM 的强大功能与检索模型结合，应用于专有知识数据库。然而，对于开发人员来说，一个主要挑战是将各种文档格式（如 PDF、HTML 等）转换为可供文本模型处理的格式。

来自主题: AI技术研报

11012 点击 2024-07-21 14:12

冰毒配方脱口而出，过去时态让GPT-4o防线崩塌！成功率从1%暴涨至88%

最高端的大模型，往往需要最朴实的语言破解。来自EPFL机构研究人员发现，仅将一句有害请求，改写成过去时态，包括GPT-4o、Llama 3等大模型纷纷沦陷了。

来自主题: AI资讯

9130 点击 2024-07-21 00:27

脑科学融合端到端，自动驾驶迎来Next Level？

Nullmax的“类脑”模型，是直接参考斑马鱼脑结构设计，不同于其他几家端到端方案思路，因此Nullmax在数据驱动的端到端基础上，提出了“智能驱动”。

来自主题: AI资讯

7369 点击 2024-07-21 00:07

从LLM到AI Agent，从Workflow到Agentic Workflow，25篇论文全面了解智能体工作流

著名AI学者、斯坦福大学教授吴恩达提出了AI Agent的四种设计方式后，Agentic Workflow（智能体工作流）立即火爆全球，多个行业都在实践智能体工作流的应用，并推动了新的Agentic AI探索热潮。

来自主题: AI技术研报

11917 点击 2024-07-19 16:34

如何将 LLM 的上下文扩展至百万级？

在2023年初，即便是当时最先进的GPT-3.5，其上下文长度也仅限于2k。然而，时至今日，1M的上下文长度已经成为衡量模型技术先进性的重要标志之一。

来自主题: AI技术研报

7001 点击 2024-07-19 10:14

ACL 2024 | 对25个开闭源模型数学评测，GPT-3.5-Turbo才勉强及格

大型语言模型（LLMs）在解决问题方面的非凡能力日益显现。最近，一个值得关注的现象是，这些模型在多项数学推理的基准测试中获得了惊人的成绩。以 GPT-4 为例，在高难度小学应用题测试集 GSM8K [1] 中表现优异，准确率高达 90% 以上。同时，许多开源模型也展现出了不俗的实力，准确率超过 80%。

来自主题: AI资讯

9092 点击 2024-07-18 16:57

清华夺SIGIR 2024「时间检验+最佳论文奖」！中国大陆研究机构首次牵头获奖

刚刚，信息检索领域的国际顶会SIGIR 2024，公布了最终获奖结果。在所有获奖名单中，来自清华计算机系的团队们斩获了两大奖项——时间检验奖、最佳论文奖，实至名归！

来自主题: AI资讯

6647 点击 2024-07-18 16:26