AI资讯新闻榜单内容搜索-内存

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 内存
存储大厂“激战”HBM

存储大厂“激战”HBM

存储大厂“激战”HBM

HBM因AI大模型训练需求爆增,市场火热。

来自主题: AI资讯
4853 点击    2024-07-15 13:44
Adam有了mini版:内存占用少一半,吞吐量提升50%

Adam有了mini版:内存占用少一半,吞吐量提升50%

Adam有了mini版:内存占用少一半,吞吐量提升50%

在训练大型语言模型(LLM)时,Adam(W) 基本上已经成为了人们默认使用的优化器。

来自主题: AI技术研报
8433 点击    2024-07-06 19:01
ICML 2024高分论文 | 零阶优化器微调大模型,大幅降低内存

ICML 2024高分论文 | 零阶优化器微调大模型,大幅降低内存

ICML 2024高分论文 | 零阶优化器微调大模型,大幅降低内存

开源大语言模型(LLM)百花齐放,为了让它们适应各种下游任务,微调(fine-tuning)是最广泛采用的基本方法。基于自动微分技术(auto-differentiation)的一阶优化器(SGD、Adam 等)虽然在模型微调中占据主流,然而在模型越来越大的今天,却带来越来越大的显存压力。

来自主题: AI技术研报
9781 点击    2024-07-04 13:35
Apple的AI奠基性论文解读

Apple的AI奠基性论文解读

Apple的AI奠基性论文解读

如何在有限的内存下实现高效的大模型推理,是端侧AI发展的重要任务。

来自主题: AI技术研报
9476 点击    2024-06-27 10:40
ICML 2024 | 信号表征指数级强、内存节省超35%,量子隐式表征网络来了

ICML 2024 | 信号表征指数级强、内存节省超35%,量子隐式表征网络来了

ICML 2024 | 信号表征指数级强、内存节省超35%,量子隐式表征网络来了

天津大学量子智能与语言理解团队创新性地将量子计算引入隐式神经表征领域,提出了量子隐式表征网络(Quantum Implicit Representation Network, QIREN)。

来自主题: AI技术研报
6031 点击    2024-06-26 16:45
大模型压缩量化方案怎么选?无问芯穹Qllm-Eval量化方案全面评估:多模型、多参数、多维度

大模型压缩量化方案怎么选?无问芯穹Qllm-Eval量化方案全面评估:多模型、多参数、多维度

大模型压缩量化方案怎么选?无问芯穹Qllm-Eval量化方案全面评估:多模型、多参数、多维度

基于 Transformer架构的大型语言模型在各种基准测试中展现出优异性能,但数百亿、千亿乃至万亿量级的参数规模会带来高昂的服务成本。例如GPT-3有1750亿参数,采用FP16存储,模型大小约为350GB,而即使是英伟达最新的B200 GPU 内存也只有192GB ,更不用说其他GPU和边缘设备。

来自主题: AI技术研报
8647 点击    2024-06-19 23:30
突发!美政府欲限制AI芯片核心技术GAA、高带宽内存HBM出口

突发!美政府欲限制AI芯片核心技术GAA、高带宽内存HBM出口

突发!美政府欲限制AI芯片核心技术GAA、高带宽内存HBM出口

外媒最新消息称,美国政府正在考虑进一步限制中国获得尖端半导体技术,包括用于制造AI加速器的关键硬件技术全环绕栅极(GAA)和高带宽内存(HBM)。

来自主题: AI资讯
5324 点击    2024-06-13 11:29
英特尔牙膏挤爆:功耗降40%、AI算力120TOPS,你的下一代笔记本没有内存条了

英特尔牙膏挤爆:功耗降40%、AI算力120TOPS,你的下一代笔记本没有内存条了

英特尔牙膏挤爆:功耗降40%、AI算力120TOPS,你的下一代笔记本没有内存条了

英特尔为了AI,再次做出重大架构变革: 像手机一样搞起SoC(系统级芯片),你的下一台笔记本不会再有独立内存条。 刚刚推出的新一代AI PC低功耗移动平台架构Lunar Lake,采用全新MoP(Memory on Package)封装,片上集成16或32GB的LPDDR5X内存,无法再额外连接更多RAM。

来自主题: AI资讯
9324 点击    2024-06-05 23:12