AI资讯新闻榜单内容搜索-语言模型

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 语言模型

LangFlow: 挑战离散扩散，探索下一代语言模型新范式

LangFlow: 挑战离散扩散，探索下一代语言模型新范式

LangFlow: 挑战离散扩散，探索下一代语言模型新范式

主要作者团队：Yuxin Chen 现为伊利诺伊大学厄巴纳 - 香槟分校（UIUC）硕士一年级学生，Chumeng Liang 为 UIUC 博士一年级学生，Hangke Sui 为 UIUC 博士二年级学生，Ge Liu 为 UIUC 计算机系助理教授。Liu Lab 团队长期聚焦扩散 / 流模型方向，

来自主题: AI技术研报

7249 点击 2026-04-29 09:36

ICLR 2026 | ProSafePrune：一剪见效，告别大模型过度防御

ICLR 2026 | ProSafePrune：一剪见效，告别大模型过度防御

ICLR 2026 | ProSafePrune：一剪见效，告别大模型过度防御

当你问 AI 「如何关掉房间的灯（how to kill the lights）」，却被冰冷拒绝「无法提供相关帮助」；当你想探讨「黑客技术的正向应用」，得到的却是「拒绝涉及非法活动」的机械回应 —— 你遇到的正是大语言模型（LLMs）的「过度拒绝」（over-refusal）痛点。

来自主题: AI技术研报

10523 点击 2026-04-23 14:06

ATOM Report：中国开源模型已经全面领先，而且差距还在扩大

ATOM Report：中国开源模型已经全面领先，而且差距还在扩大

ATOM Report：中国开源模型已经全面领先，而且差距还在扩大

2026 年 4 月，Nathan Lambert 和 Florian Brand 发布了 The ATOM Report，一份关于开源语言模型生态的综合采纳度快照。这份报告追踪了约 1500 个主线开源模型的下载量、衍生模型、推理市场份额和性能数据，覆盖 2023 年 11 月到 2026 年 3 月

来自主题: AI资讯

9692 点击 2026-04-09 14:47

比全球最强推理引擎还快2倍，斯坦福、普林斯顿破解大模型「串行魔咒」

比全球最强推理引擎还快2倍，斯坦福、普林斯顿破解大模型「串行魔咒」

比全球最强推理引擎还快2倍，斯坦福、普林斯顿破解大模型「串行魔咒」

在大语言模型推理领域，虽然「推测解码」（Speculative Decoding，SD）已成为加速生成的标准配置，但它依然存在一个致命弱点： drafting（草拟）和 verification（验证）之间必须串行进行。

来自主题: AI技术研报

8125 点击 2026-04-01 16:20

Nicholas Carlini：当 AI 比所有人都更擅长找漏洞，安全行业还剩几个月？

Nicholas Carlini：当 AI 比所有人都更擅长找漏洞，安全行业还剩几个月？

Nicholas Carlini：当 AI 比所有人都更擅长找漏洞，安全行业还剩几个月？

Anthropic 研究科学家 Nicholas Carlini 在 [un]prompted 2026 安全会议上用不到 25 分钟演示了一件事：语言模型现在可以自主找到并利用零日漏洞，目标包括 Linux 内核这种被人类安全专家审计了几十年的软件。

来自主题: AI技术研报

10603 点击 2026-03-31 14:06

大部分人都没有的习惯，斯坦福最新报告证实：点踩对AI来说其实很重要！

大部分人都没有的习惯，斯坦福最新报告证实：点踩对AI来说其实很重要！

大部分人都没有的习惯，斯坦福最新报告证实：点踩对AI来说其实很重要！

您在使用LLM时，如果遇到它胡说八道或者彻底偏题，第一反应是什么？大概率是直接关掉窗口，新开一个对话，懒得跟机器废话。但您可能不知道，这个看似再正常不过的习惯，正在给下一代大语言模型的训练库疯狂“投毒”。

来自主题: AI技术研报

9009 点击 2026-03-31 10:03

AI超懂人情世故，但人类就吃这一套：AI谄媚研究登上《科学》杂志

AI超懂人情世故，但人类就吃这一套：AI谄媚研究登上《科学》杂志

AI超懂人情世故，但人类就吃这一套：AI谄媚研究登上《科学》杂志

自从大语言模型诞生起至今，AI 已经润物无声地融入了我们的工作生活，也成为了现代社会的重要组成部分。

来自主题: AI技术研报

6840 点击 2026-03-30 16:06

东方理工团队提出HiDrop：重构MLLM计算路径，压缩90%视觉Token实现2.2倍加速

东方理工团队提出HiDrop：重构MLLM计算路径，压缩90%视觉Token实现2.2倍加速

东方理工团队提出HiDrop：重构MLLM计算路径，压缩90%视觉Token实现2.2倍加速

随着多模态大语言模型（MLLM）支持更长上下文，高分辨率图像和长视频会产生远多于文本的视觉 Token，在自注意力二次复杂度下迅速成为效率瓶颈。

来自主题: AI技术研报

9526 点击 2026-03-24 10:13

扩散语言模型总是均匀发力，华为诺亚教它「抓重点」

扩散语言模型总是均匀发力，华为诺亚教它「抓重点」

扩散语言模型总是均匀发力，华为诺亚教它「抓重点」

这两年，扩散语言模型（Diffusion LLM）一直是个很有讨论度的方向。

来自主题: AI技术研报

6496 点击 2026-03-23 09:51

打破视频推理「先看后想」惯性，实现真正的「边看边想」丨CVPR'26

打破视频推理「先看后想」惯性，实现真正的「边看边想」丨CVPR'26

打破视频推理「先看后想」惯性，实现真正的「边看边想」丨CVPR'26

今天的大型视觉语言模型（VLM）做离线视频分析很强，但一到实时场景就尴尬：视频在往前走，模型还在“补作业”。

来自主题: AI技术研报

7360 点击 2026-03-18 14:12

上一页当前第5页,共108页下一页