AI资讯新闻榜单内容搜索-语言模型

7B扩散语言模型单样例1000+ tokens/s！上交大联合华为推出LoPA

，时长 00:20 视频 1：单样例推理速度对比：SGLang 部署的 Qwen3-8B (NVIDIA) vs. LoPA-Dist 部署 (NVIDIA & Ascend)（注：NVIDIA 平台

来自主题: AI技术研报

7550 点击 2026-01-01 10:09

黄仁勋「收购式」抢人继续：20多亿美金“买走”Mobileye创始人AI新团队

财大气粗的老黄，又要出手了！为了将200多位顶尖AI人才纳入麾下，英伟达被曝拟用20~30亿美金收购一家以色列AI初创公司。这家公司名为AI21 Labs，是以色列为数不多的自主研发大语言模型的公司，其联创还曾创办了明星自动驾驶公司Mobileye（Mobileye被收购后成了英特尔副总裁）。

来自主题: AI资讯

9019 点击 2025-12-31 15:15

自回归因果注意力也能并行解码？上交联合UCSD突破LLM推理瓶颈，模型代码全开源

在大语言模型（LLM）落地应用中，推理速度始终是制约效率的核心瓶颈。传统自回归（AR）解码虽能保证生成质量，却需逐 token 串行计算，速度极为缓慢；扩散型 LLM（dLLMs）虽支持并行解码，却面

来自主题: AI技术研报

7485 点击 2025-12-31 09:21

AI4S回归白盒符号主义，清华等联合发布SR-LLM：自主发现科学知识

清华大学等多所高校联合发布SR-LLM，这是一种融合大语言模型与深度强化学习的符号回归框架。它通过检索增强和语义推理，从数据中生成简洁、可解释的数学模型，显著优于现有方法。在跟车行为建模等任务中，SR-LLM不仅复现经典模型，还发现更优新模型，为机器自主科学发现开辟新路径。

来自主题: AI技术研报

9619 点击 2025-12-29 14:37

告别「单线程」思维：通研院提出NPR框架，让智能体进化出原生的并行推理大脑

近年来，大语言模型在「写得长、写得顺」这件事上进步飞快。但当任务升级到真正复杂的推理场景 —— 需要兵分多路探索、需要自我反思与相互印证、需要在多条线索之间做汇总与取舍时，传统的链式思维（Chain-of-Thought）往往就开始「吃力」：容易被早期判断带偏、发散不足、自我纠错弱，而且顺序生成的效率天然受限。

来自主题: AI技术研报

10053 点击 2025-12-29 09:36