AI资讯新闻榜单内容搜索-语言模型

里程碑时刻！首个100B扩散语言模型来了，技术报告揭秘背后细节

前段时间，我们在 HuggingFace 页面发现了两个新模型：LLaDA2.0-mini 和 LLaDA2.0-flash。它们来自蚂蚁集团与人大、浙大、西湖大学组成的联合团队，都采用了 MoE 架构。前者总参数量为 16B，后者总参数量则高达 100B—— 在「扩散语言模型」这个领域，这是从未见过的规模。

来自主题: AI资讯

10511 点击 2025-12-12 16:08

谷歌发布智能体Scaling Law：180组实验打破传统炼金术

智能体（Agent），即基于语言模型且具备推理、规划和行动能力的系统，正在成为现实世界 AI 应用的主导范式。

来自主题: AI技术研报

7102 点击 2025-12-12 10:27

前百川智能合伙人邓江创业，想走一条不同的AI医疗路

在AI医疗的技术路线和商业模式上，双方走向了不同的方向：百川押注语言模型和ToC，邓江拥抱多模态和ToB。

来自主题: AI资讯

7118 点击 2025-12-11 16:05

扩散语言模型推理太慢？北大团队提出ODB-dLLM框架，破解计算访存双重瓶颈

基于扩散的大语言模型 (dLLM) 凭借全局解码和双向注意力机制解锁了原生的并行解码和受控生成的潜力，最近吸引了广泛的关注。例如 Fast-dLLM 的现有推理框架通过分块半自回归解码进一步实现了 dLLM 对 KV cache 的支持，挑战了传统自回归 LLMs 的统治地位。

来自主题: AI技术研报

6949 点击 2025-12-11 10:42

LLM距离AGI只差一层：斯坦福研究颠覆「模式匹配」观点

有关大语言模型的理论基础，可能要出现一些改变了。

来自主题: AI技术研报

10611 点击 2025-12-11 10:10

Jina-VLM：可在笔记本上跑的多语言视觉小模型

今天我们正式发布 Jina-VLM，这是一款 2.4B 参数量的视觉语言模型（VLM），在同等规模下达到了多语言视觉问答（Multilingual VQA）任务上的 SOTA 基准。Jina-VLM 对硬件需求较低，可在普通消费级显卡或 Macbook 上流畅运行。

来自主题: AI资讯

8990 点击 2025-12-09 14:48

DeepSeek、Gemini谁更能提供情感支持？趣丸×北大来了波情绪轨迹动态评估

近日，由趣丸科技与北京大学软件工程国家工程研究中心共同发表的《Detecting Emotional Dynamic Trajectories: An Evaluation Framework for Emotional Support in Language Models（检测情感动态轨迹：大语言模型情感支持的评估框架）》论文，获 AAAI 2026 录用。

来自主题: AI技术研报

9630 点击 2025-12-08 14:13

LLM强化学习不稳定之谜，被Qwen团队从「一阶近似」视角解开

如今，强化学习（RL）已成为提升大语言模型（LLM）复杂推理与解题能力的关键技术范式，而稳定的训练过程对于成功扩展 RL 至关重要。由于语言具有强烈的上下文属性，LLM 的 RL 通常依赖序列级奖励 —— 即根据完整生成序列给一个标量分数。

来自主题: AI技术研报

6404 点击 2025-12-08 10:27

近乎零成本破解模型幻觉！清华团队最新研究：逆向验证法，让 AI 停止“瞎扯”，只需先验证再作答

关于如何避免让大语言模型产生幻觉，一直以来的相关研究都非常多。

来自主题: AI技术研报

6592 点击 2025-12-08 09:47

人们用AI在做什么？答案藏在100万亿token背后

2025 年 12 月，硅谷风险投资机构 Andreessen Horowitz（简称 a16z）与 AI 推理服务平台 OpenRouter 联合发布了一份名为《State of AI》的研究报告。这份报告基于 OpenRouter 平台上超过 100 万亿 token 的真实用户交互数据，试图呈现过去一年间大语言模型在实际应用中的真实状态。

来自主题: AI技术研报

10671 点击 2025-12-06 10:22