AI资讯新闻榜单内容搜索-2

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 2
上交大等探索键值压缩的边界:MILLION开源框架定义模型量化推理新范式,入选顶会DAC 2025

上交大等探索键值压缩的边界:MILLION开源框架定义模型量化推理新范式,入选顶会DAC 2025

上交大等探索键值压缩的边界:MILLION开源框架定义模型量化推理新范式,入选顶会DAC 2025

在以 transformer 模型为基础的大模型中,键值缓存虽然用以存代算的思想显著加速了推理速度,但在长上下文场景中成为了存储瓶颈。为此,本文的研究者提出了 MILLION,一种基于乘积量化的键值缓存压缩和推理加速设计。

来自主题: AI技术研报
8865 点击    2025-04-30 08:32
ICLR 2025|首个动态视觉-文本稀疏化框架来了,计算开销直降50%-75%

ICLR 2025|首个动态视觉-文本稀疏化框架来了,计算开销直降50%-75%

ICLR 2025|首个动态视觉-文本稀疏化框架来了,计算开销直降50%-75%

多模态大模型(MLLMs)在视觉理解与推理等领域取得了显著成就。然而,随着解码(decoding)阶段不断生成新的 token,推理过程的计算复杂度和 GPU 显存占用逐渐增加,这导致了多模态大模型推理效率的降低。

来自主题: AI技术研报
7261 点击    2025-04-29 14:56
在美打拼12年被迫离开!GPT-4.5幕后功臣绿卡申请三年后遭拒

在美打拼12年被迫离开!GPT-4.5幕后功臣绿卡申请三年后遭拒

在美打拼12年被迫离开!GPT-4.5幕后功臣绿卡申请三年后遭拒

在全球 AI 人才争夺战愈演愈烈的今天,许多技术人却不得不面对一种无力的现实。最近,OpenAI 的一位核心研究员 Kai Chen,因绿卡申请被拒,不得不离开美国,这一消息在科技圈引发了广泛关注。

来自主题: AI资讯
8152 点击    2025-04-29 10:39
52页PPT,谷歌Gemini预训练负责人首次揭秘!扩展定律最优解

52页PPT,谷歌Gemini预训练负责人首次揭秘!扩展定律最优解

52页PPT,谷歌Gemini预训练负责人首次揭秘!扩展定律最优解

大模型之战烽火正酣,谷歌Gemini 2.5 Pro却强势逆袭!Gemini Flash预训练负责人亲自揭秘,深挖Gemini预训练的关键技术,看谷歌如何在模型大小、算力、数据和推理成本间找到最优解。

来自主题: AI技术研报
8688 点击    2025-04-29 09:43
五人团队、两周时间:他们正用AI做连载动画 | 早期项目

五人团队、两周时间:他们正用AI做连载动画 | 早期项目

五人团队、两周时间:他们正用AI做连载动画 | 早期项目

2024年底,「与光同尘」推出的全球首部纯AI连载动画《果果星球》于11月16日正式首发上线,故事设定在遥远的1105光年之外,一个只有水果蔬菜存在的“果果星球”上,主角是一群可爱的果蔬人类“吃土星人”,他们的冒险由此开始。

来自主题: AI资讯
10448 点击    2025-04-29 09:37
政务大模型的春天,AI办公先萌芽

政务大模型的春天,AI办公先萌芽

政务大模型的春天,AI办公先萌芽

“2月16日那一周,感觉全中国的政府企业都在上Deepseek,甚至很多单位原来一张卡都没有,突然就有了DeepSeek满血版。”金山办公Office产研事业部副总经理刘丹说道,“那段时间我认识的大部分领导也都在问,‘你们到底什么时候接,怎么样的节奏’,整个行业都特别火热。”

来自主题: AI资讯
8208 点击    2025-04-29 09:34
融了3个亿的张月光,就做出了个“AI播客播放器”

融了3个亿的张月光,就做出了个“AI播客播放器”

融了3个亿的张月光,就做出了个“AI播客播放器”

2023 年 7 月份,我们曾经观察过妙鸭相机靠 AI 写真功能一炮而红,又快速陨落的全过程。而在产品数据下滑的同时,同年 11 月 13 日,妙鸭相机对外确认,产品负责人张月光离职。

来自主题: AI资讯
9450 点击    2025-04-29 09:31