AI资讯新闻榜单内容搜索-内存

突发！美政府欲限制AI芯片核心技术GAA、高带宽内存HBM出口

外媒最新消息称，美国政府正在考虑进一步限制中国获得尖端半导体技术，包括用于制造AI加速器的关键硬件技术全环绕栅极（GAA）和高带宽内存（HBM）。

来自主题: AI资讯

5820 点击 2024-06-13 11:29

英特尔牙膏挤爆：功耗降40%、AI算力120TOPS，你的下一代笔记本没有内存条了

英特尔为了AI，再次做出重大架构变革：像手机一样搞起SoC（系统级芯片），你的下一台笔记本不会再有独立内存条。刚刚推出的新一代AI PC低功耗移动平台架构Lunar Lake，采用全新MoP（Memory on Package）封装，片上集成16或32GB的LPDDR5X内存，无法再额外连接更多RAM。

来自主题: AI资讯

9950 点击 2024-06-05 23:12

英特尔Lunar Lake「统一内存」，一切都是为了AI

英特尔终究还是学了苹果。

来自主题: AI资讯

8924 点击 2024-06-05 17:55

独角兽被微软挖角，新团队首曝光！情感AI嵌入机器人，超大内存升级情感体验

AI独角兽Inflection AI，在经历投资方微软「挖角」之后，近况如何？在上周接受VentureBeat独家采访时，Inflection AI公布了其由经验丰富的硅谷老将组成的新领导团队，公司目前资金充足，正在扩大其工程团队。计划将情感AI嵌入商业机器人，凭借其在AI情感智能领域的领先地位进军2B市场。

来自主题: AI资讯

9729 点击 2024-05-28 13:47

Bengio等人新作：注意力可被视为RNN，新模型媲美Transformer，但超级省内存

既能像 Transformer 一样并行训练，推理时内存需求又不随 token 数线性递增，长上下文又有新思路了？

来自主题: AI技术研报

7349 点击 2024-05-25 18:07

AI内存瓶颈（上）：3D NAND路线图

随着AI带来的算力需求大爆发，以半导体为代表的各类硬件企业的营收也纷纷水涨船高。

来自主题: AI技术研报

7885 点击 2024-05-20 16:41

微软打破Decoder-Only架构！大幅降低GPU内存需求，网友：把Llama3 70B弄20GB GPU上运行

微软&清华最新研究，打破GPT系列开创的Decoder-Only架构——

来自主题: AI技术研报

5721 点击 2024-05-12 12:51

3倍生成速度还降内存成本，超越Medusa2的高效解码框架终于来了

传统上，大型语言模型（LLMs）被认为是顺序解码器，逐个解码每个token。

来自主题: AI技术研报

4414 点击 2024-05-10 23:29

处理器AI性能平白“翻倍”？错误报道背后的故事

2024年4月下旬，AMD方面发布了锐龙8000系列的专业向桌面版产品线，也就是锐龙PRO的8000系列家族。与大家熟知的“普通版”锐龙8000系列相比，“专业线”的锐龙PRO 8000系列其实变化并不大，它们主要是增加了对于微软安全处理器（Microsoft Pluton）、ECC内存、安全虚拟化，以及远程管理等专业功能的支持。

来自主题: AI资讯

8359 点击 2024-04-29 11:19

谷歌：假如AI大模型支持无限长上下文，会如何？

为解决大模型（LLMs）在处理超长输入序列时遇到的内存限制问题，本文作者提出了一种新型架构：Infini-Transformer，它可以在有限内存条件下，让基于Transformer的大语言模型（LLMs）高效处理无限长的输入序列。实验结果表明：Infini-Transformer在长上下文语言建模任务上超越了基线模型，内存最高可节约114倍。

来自主题: AI资讯

8630 点击 2024-04-14 11:32