AI资讯新闻榜单内容搜索-LLMs

COLM 24 | 从正确中学习？大模型的自我纠正新视角

大型语言模型（LLMs）虽然进展很快，很强大，但是它们仍然存在会产生幻觉、生成有害内容和不遵守人类指令等问题。一种流行的解决方案就是基于【自我纠正】，大概就是看自己输出的结果，自己反思一下有没有错，如果有错就自己改正。目前自己纠正还是比较关注于让大模型从错误中进行学习。

来自主题: AI技术研报

8165 点击 2024-09-17 21:26

你以为的LLM上下文学习超能力，究竟来自哪里，ICL的内部机制如何 |最新发布

上下文学习(In-Context Learning， ICL)是指LLMs能够仅通过提示中给出的少量样例，就迅速掌握并执行新任务的能力。这种“超能力”让LLMs表现得像是一个"万能学习者"，能够在各种场景下快速适应并产生高质量输出。然而，关于ICL的内部机制，学界一直存在争议。

来自主题: AI资讯

4807 点击 2024-09-11 10:17

一文搞懂SFT、RLHF、DPO、IFT

SFT、RLHF 和 DPO 都是先估计 LLMs 本身的偏好，再与人类的偏好进行对齐

来自主题: AI资讯

6026 点击 2024-08-22 17:04

LLM推理性能受输出格式影响，JSON最严重

输出格式不同，竟然还能影响大模型发挥？！

来自主题: AI资讯

9802 点击 2024-08-16 21:15

大模型长文本阅读能力如何评估？

长文本处理能力对LLM的重要性是显而易见的。在2023年初，即便是当时最先进的GPT-3.5，其上下文长度也仅限于2k，然而今日，128k的上下文长度已经成为衡量模型技术先进性的重要标志之一。那你知道LLMs的长文本阅读能力如何评估吗？

来自主题: AI资讯

6672 点击 2024-08-14 11:25

CPU反超NPU，llama.cpp生成速度翻5倍！LLM端侧部署新范式T-MAC开源

T-MAC是一种创新的基于查找表（LUT）的方法，专为在CPU上高效执行低比特大型语言模型（LLMs）推理而设计，无需权重反量化，支持混合精度矩阵乘法（mpGEMM），显著降低了推理开销并提升了计算速度。

来自主题: AI资讯

5332 点击 2024-08-13 17:42

让AI管理大型代码库，开发者福音来了 | 阿里/新加坡国立/西安交大联合出品

代码生成和补全任务做不完了？！

来自主题: AI资讯

8845 点击 2024-08-11 17:18

ACL 2024 Oral｜我们离真正的多模态思维链推理还有多远？

在过去的几年中，大型语言模型（Large Language Models, LLMs）在自然语言处理（NLP）领域取得了突破性的进展。这些模型不仅能够理解复杂的语境，还能够生成连贯且逻辑严谨的文本。

来自主题: AI技术研报

8921 点击 2024-08-11 13:25

a16z前合伙人：大模型从技术突破到产品颠覆，还需最后一跃

数以亿计的人体验过ChatGPT，但许多人尝试过后便未再回头。每家大型企业也都曾尝试过相关试点项目，但真正投入应用的却寥寥无几。这其中部分原因可能只是时间问题。然而，大型语言模型（LLMs）可能也存在陷阱：它们看似是产品，给人以神奇之感，但实际上并非如此。或许，我们终究需要经历寻找产品与市场契合点的漫长而单调的探索过程。

来自主题: AI资讯

5376 点击 2024-08-08 09:32

ACL 2024 Oral | 大模型也会被忽悠？揭秘AI的信念之旅

地球是平的吗？当然不是。自古希腊数学家毕达哥拉斯首次提出地圆说以来，现代科学技术已经证明了地球是圆形这一事实。但是，你有没有想过，如果 AI 被误导性信息 “忽悠” 了，会发生什么？来自清华、上海交大、斯坦福和南洋理工的研究人员在最新的论文中深入探索 LLMs 在虚假信息干扰情况下的表现，他们发现大语言模型在误导信息反复劝说下，非常自信地做出「地球是平的」这一判断。

来自主题: AI资讯

2890 点击 2024-08-07 11:20