AI资讯新闻榜单内容搜索-语言模型

华为GTS LocMoE+：高可扩展性亲和度 MoE 架构，低开销实现主动路由

MoE 因其在训推流程中低销高效的特点，近两年在大语言模型领域大放异彩。作为 MoE 的灵魂，专家如何能够发挥出最大的学习潜能，相关的研究与讨论层出不穷。此前，华为 GTS AI 计算 Lab 的研究团队提出了 LocMoE ，包括新颖的路由网络结构、辅助降低通信开销的本地性 loss 等，引发了广泛关注。

来自主题: AI技术研报

6467 点击 2024-07-19 16:16

ACL 2024 | 对25个开闭源模型数学评测，GPT-3.5-Turbo才勉强及格

大型语言模型（LLMs）在解决问题方面的非凡能力日益显现。最近，一个值得关注的现象是，这些模型在多项数学推理的基准测试中获得了惊人的成绩。以 GPT-4 为例，在高难度小学应用题测试集 GSM8K [1] 中表现优异，准确率高达 90% 以上。同时，许多开源模型也展现出了不俗的实力，准确率超过 80%。

来自主题: AI资讯

9097 点击 2024-07-18 16:57

无损加速最高5x，EAGLE-2让RTX 3060的生成速度超过A100

自回归解码已经成为了大语言模型（LLMs）的事实标准，大语言模型每次前向计算需要访问它全部的参数，但只能得到一个token，导致其生成昂贵且缓慢。

来自主题: AI技术研报

11199 点击 2024-07-17 20:33

VLM集体「失明」？视力测试惨败，GPT-4o、Claude 3.5全都不及格

视觉大语言模型在最基础的视觉任务上集体「翻车」，即便是简单的图形识别都能难倒一片，或许这些最先进的VLM还没有发展出真正的视觉能力？

来自主题: AI技术研报

10195 点击 2024-07-16 19:43

你真的了解CoT？普林斯顿大学解密影响CoT效率的因素，引用5875次的CoT讲了啥

2022年，Google研究团队发表了名为《思路链提示引发大型语言模型的推理》的开创性论文，引入了思维链(Chain of Thought， CoT)prompting技术。

来自主题: AI资讯

5583 点击 2024-07-15 14:18

豆包大模型团队发布全新Detail Image Caption评估基准，提升VLM Caption评测可靠性

当前的视觉语言模型（VLM）主要通过 QA 问答形式进行性能评测，而缺乏对模型基础理解能力的评测，例如 detail image caption 性能的可靠评测手段。

来自主题: AI技术研报

11756 点击 2024-07-13 20:01

OpenAI Lilian Weng万字长文解读LLM幻觉：从理解到克服

人会有幻觉，大型语言模型也会有幻觉。近日，OpenAI 安全系统团队负责人 Lilian Weng 更新了博客，介绍了近年来在理解、检测和克服 LLM 幻觉方面的诸多研究成果。

来自主题: AI资讯

6320 点击 2024-07-13 19:46

首个视频思维链推理框架Video-of-Thought来了：像人一样从感知到认知全面推理视频

最近，新加坡国立大学联合南洋理工大学和哈工深的研究人员共同提出了一个全新的视频推理框架，这也是首次大模型推理社区提出的面向视频的思维链框架（Video-of-Thought， VoT）。视频思维链VoT让视频多模态大语言模型在复杂视频的理解和推理性能上大幅提升。该工作已被ICML 2024录用为Oral paper。

来自主题: AI技术研报

11755 点击 2024-07-12 17:54

深度解析RAG大模型知识冲突，清华西湖大学港中文联合发布

随着人工智能和大型模型技术的迅猛发展，检索增强生成（Retrieval-Augmented Generation, RAG）已成为大型语言模型生成文本的一种主要范式。

来自主题: AI技术研报

11648 点击 2024-07-10 18:43

大模型最强架构TTT问世！斯坦福UCSD等5年磨一剑，一夜推翻Transformer

超越Transformer和Mamba的新架构，刚刚诞生了。斯坦福UCSD等机构研究者提出的TTT方法，直接替代了注意力机制，语言模型方法从此或将彻底改变。

来自主题: AI技术研报

7563 点击 2024-07-09 15:41

AI资讯新闻榜单内容搜索-语言模型

华为GTS LocMoE+：高可扩展性亲和度 MoE 架构，低开销实现主动路由

ACL 2024 | 对25个开闭源模型数学评测，GPT-3.5-Turbo才勉强及格

无损加速最高5x，EAGLE-2让RTX 3060的生成速度超过A100

VLM集体「失明」？视力测试惨败，GPT-4o、Claude 3.5全都不及格

你真的了解CoT？普林斯顿大学解密影响CoT效率的因素，引用5875次的CoT讲了啥

豆包大模型团队发布全新Detail Image Caption评估基准，提升VLM Caption评测可靠性

OpenAI Lilian Weng万字长文解读LLM幻觉：从理解到克服

首个视频思维链推理框架Video-of-Thought来了：像人一样从感知到认知全面推理视频

深度解析RAG大模型知识冲突，清华西湖大学港中文联合发布

大模型最强架构TTT问世！斯坦福UCSD等5年磨一剑， 一夜推翻Transformer

大模型最强架构TTT问世！斯坦福UCSD等5年磨一剑，一夜推翻Transformer