AI资讯新闻榜单内容搜索-大语言模型

跳出「黑盒」，人大刘勇团队最新大语言模型理论与机理综述

大语言模型（LLMs）的爆发式增长引领了人工智能领域的范式转移，取得了巨大的工程成功。然而，一个关键的悖论依然存在：尽管 LLMs 在实践中表现卓越，但其理论研究仍处于起步阶段，导致这些系统在很大程度上被视为难以捉摸的「黑盒」。

来自主题: AI技术研报

6941 点击 2026-01-16 10:09

在 AI 辅助 Coding 技术快速发展的背景下，大语言模型（LLMs）虽显著提升了软件开发效率，但开源的 LLMs 生成的代码依旧存在运行时错误，增加了开发者调试成本。

来自主题: AI技术研报

10047 点击 2026-01-14 15:28

现在，我们越来越多地将大语言模型应用于搜索、编程、内容生成和决策辅助等现实场景中。尽管每天有数百万人使用大模型，但它的问题也随之而来，例如有时会产生幻觉，甚至在特定情境下表现出误导或欺骗用户的倾向。

来自主题: AI资讯

9121 点击 2026-01-13 16:09

近年来，大语言模型在算术、逻辑、多模态理解等任务上之所以取得显著进展，很大程度上依赖于思维链（CoT）技术。所谓 CoT，就是让模型在给出最终答案前，先生成一系列类似「解题步骤」的中间推理。这种方式

来自主题: AI技术研报

6814 点击 2026-01-10 17:00

尽管多模态大语言模型（MLLMs）在识别「图中有什么」这一语义层面上取得了巨大进步，但在理解「图像看起来怎么样」这一感知层面上仍显乏力。

来自主题: AI技术研报

6853 点击 2026-01-08 15:23

2023年启动大模型研发以来，腾讯第一次把大语言模型变成一把手工程，负责人是个27岁的年轻人；

来自主题: AI资讯

8701 点击 2026-01-08 09:27

空间理解能力是多模态大语言模型（MLLMs）走向真实物理世界，成为 “通用型智能助手” 的关键基础。但现有的空间智能评测基准往往有两类问题：一类高度依赖模板生成，限制了问题的多样性；另一类仅聚焦于某一种空间任务与受限场景，因此很难全面检验模型在真实世界中对空间的理解与推理能力。

来自主题: AI技术研报

8566 点击 2026-01-06 09:50

财大气粗的老黄，又要出手了！为了将200多位顶尖AI人才纳入麾下，英伟达被曝拟用20~30亿美金收购一家以色列AI初创公司。这家公司名为AI21 Labs，是以色列为数不多的自主研发大语言模型的公司，其联创还曾创办了明星自动驾驶公司Mobileye（Mobileye被收购后成了英特尔副总裁）。

来自主题: AI资讯

10369 点击 2025-12-31 15:15

在大语言模型（LLM）落地应用中，推理速度始终是制约效率的核心瓶颈。传统自回归（AR）解码虽能保证生成质量，却需逐 token 串行计算，速度极为缓慢；扩散型 LLM（dLLMs）虽支持并行解码，却面

来自主题: AI技术研报

8608 点击 2025-12-31 09:21

清华大学等多所高校联合发布SR-LLM，这是一种融合大语言模型与深度强化学习的符号回归框架。它通过检索增强和语义推理，从数据中生成简洁、可解释的数学模型，显著优于现有方法。在跟车行为建模等任务中，SR-LLM不仅复现经典模型，还发现更优新模型，为机器自主科学发现开辟新路径。

来自主题: AI技术研报

10980 点击 2025-12-29 14:37