AI资讯新闻榜单内容搜索-语言模型

「liko.ai」完成首轮融资，打造以 AI Home Center 为核心的智能家居解决方案｜光源孵化

近日，liko.ai 宣布完成首轮融资，由商汤国香资本、东方富海、讯飞创投、洪泰基金、正轩投资、面壁智能等多家产业及财务投资机构联合投资，光源资本担任孵化方及独家财务顾问。本轮融资将用于端侧视觉语言模型、AI 原生硬件以及家庭多模态通用终端研发。

来自主题: AI资讯

8104 点击 2026-01-10 11:06

深入感知级别图像理解：UniPercept 统一图像美学、质量与结构纹理感知

尽管多模态大语言模型（MLLMs）在识别「图中有什么」这一语义层面上取得了巨大进步，但在理解「图像看起来怎么样」这一感知层面上仍显乏力。

来自主题: AI技术研报

5870 点击 2026-01-08 15:23

腾讯混元3年变形始末｜独家

2023年启动大模型研发以来，腾讯第一次把大语言模型变成一把手工程，负责人是个27岁的年轻人；

来自主题: AI资讯

6816 点击 2026-01-08 09:27

深度｜2026年，AI将从炒作走向务实

如果说2025 年是 AI 接受现实检验之年，那么 2026 年这项技术将走向实用化。业界焦点已从构建日益庞大的语言模型，转向更艰巨的使命——让 AI 真正可用。

来自主题: AI资讯

6922 点击 2026-01-07 17:20

空间智能终极挑战MMSI-Video-Bench来了，顶级大模型全军覆没

空间理解能力是多模态大语言模型（MLLMs）走向真实物理世界，成为 “通用型智能助手” 的关键基础。但现有的空间智能评测基准往往有两类问题：一类高度依赖模板生成，限制了问题的多样性；另一类仅聚焦于某一种空间任务与受限场景，因此很难全面检验模型在真实世界中对空间的理解与推理能力。

来自主题: AI技术研报

7517 点击 2026-01-06 09:50

DeepSeek-OCR是「长文本理解」未来方向吗？中科院新基准给出答案

DeepSeek-OCR的视觉文本压缩（VTC）技术通过将文本编码为视觉Token，实现高达10倍的压缩率，大幅降低大模型处理长文本的成本。但是，视觉语言模型能否理解压缩后的高密度信息？中科院自动化所等推出VTCBench基准测试，评估模型在视觉空间中的认知极限，包括信息检索、关联推理和长期记忆三大任务。

来自主题: AI技术研报

5394 点击 2026-01-06 09:30

MIT发现让AI变聪明的秘密，竟然和人类一模一样

你有没有发现，你让AI读一篇长文章，结果它读着读着就忘了前面的内容？你让它处理一份超长的文档，结果它给出来的答案，牛头不对马嘴？这个现象，学术界有个专门的名词，叫做上下文腐化。这也是目前AI的通病：大模型的记忆力太差了，文章越长，模型越傻！

来自主题: AI技术研报

9143 点击 2026-01-04 16:53

MIT团队推出递归语言模型！不改架构、不扩窗口，上下文处理能力扩展百倍

新年伊始，MIT CSAIL 的一纸论文在学术圈引发了不小的讨论。Alex L． Zhang 、 Tim Kraska 与 Omar Khattab 三位研究者在 arXiv 上发布了一篇题为《Recursive Language Models》的论文，提出了所谓“递归语言模型”（Recursive Language Models，简称 RLM）的推理策略。

来自主题: AI技术研报

6458 点击 2026-01-04 14:51

微信炼出扩散语言模型，实现vLLM部署AR模型3倍加速，低熵场景超10倍

近日，腾讯微信 AI 团队提出了 WeDLM（WeChat Diffusion Language Model），这是首个在工业级推理引擎（vLLM）优化条件下，推理速度超越同等 AR 模型的扩散语言模型。

来自主题: AI技术研报

9481 点击 2026-01-03 13:56

7B扩散语言模型单样例1000+ tokens/s！上交大联合华为推出LoPA

，时长 00:20 视频 1：单样例推理速度对比：SGLang 部署的 Qwen3-8B (NVIDIA) vs. LoPA-Dist 部署 (NVIDIA & Ascend)（注：NVIDIA 平台

来自主题: AI技术研报

7859 点击 2026-01-01 10:09