AI资讯新闻榜单内容搜索-内存

24B模型编程超DeepSeek全家桶，32G内存苹果电脑就能跑，专门针对真实GitHub Issue训练

Mistral沉默好久，果然在憋大招。

来自主题: AI资讯

6510 点击 2025-05-22 16:03

手机流畅处理128K长文本，vivo端侧新算法突破内存限制 | ACL 2025

在端侧设备上处理长文本常常面临计算和内存瓶颈。

来自主题: AI技术研报

9514 点击 2025-05-20 14:54

英伟达新“桌面超算”800GB大内存，满血DeepSeek R1能装1个半

英伟达官宣新办公室落户中国台湾省台北市，但居然是从太空飞下来的吗？

来自主题: AI资讯

7323 点击 2025-05-19 17:31

刚刚，DeepSeek首曝V3降成本秘诀！软硬协同突破Scaling天花板

DeepSeek最新论文深入剖析了V3/R1的开发历程，揭示了硬件与大语言模型架构协同设计的核心奥秘。论文展示了如何突破内存、计算和通信瓶颈，实现低成本、高效率的大规模AI训练与推理。不仅总结了实践经验，还为未来AI硬件与模型协同设计提出了建议。

来自主题: AI技术研报

8110 点击 2025-05-15 17:12

ICML 2025 Spotlight｜华为诺亚提出端侧大模型新架构MoLE，内存搬运代价降低1000倍

Mixture-of-Experts（MoE）在推理时仅激活每个 token 所需的一小部分专家，凭借其稀疏激活的特点，已成为当前 LLM 中的主流架构。然而，MoE 虽然显著降低了推理时的计算量，但整体参数规模依然大于同等性能的 Dense 模型，因此在显存资源极为受限的端侧部署场景中，仍然面临较大挑战。

来自主题: AI技术研报

6447 点击 2025-05-07 09:30

仅需0.4GB，参数只有0和±1！微软开源首个原生1 bit模型，CPU轻松跑

微软研究院开源的原生1bit大模型BitNet b1.58 2B4T，将低精度与高效能结合，开创了AI轻量化的新纪元。通过精心设计的推理框架，BitNet不仅突破了内存的限制，还在多项基准测试中表现出色，甚至与全精度模型不相上下。

来自主题: AI技术研报

6276 点击 2025-04-20 21:12

AI存储，不再小马拉大车

3月末，多家海外存储头部企业，宣布从4月起提高部分产品报价，国内厂商也随之上调价格，终结了DRAM内存与NAND闪存的降价势头。

来自主题: AI资讯

6487 点击 2025-04-14 08:54

手机实现GPT级智能，比MoE更极致的稀疏技术：省内存效果不减｜对话面壁&清华肖朝军

在大模型争霸的时代，算力与效率的平衡成为决定胜负的关键。

来自主题: AI技术研报

8554 点击 2025-04-12 14:38

AMD GPU性能暴涨7倍，优化算法首次开源！高效MoE支持任意专家数量

通过完全启用并发多块执行，支持任意专家数量（MAX_EXPERT_NUMBER==256），并积极利用共享内存（5kB LDS）和寄存器（52 VGPRs，48 SGPRs），MoE Align & Sort逻辑被精心设计，实现了显著的性能提升：A100提升3倍，H200提升3倍，MI100提升10倍，MI300X/MI300A提升7倍...

来自主题: AI技术研报

3246 点击 2025-04-03 16:14

新注意力让大模型上下文内存占用砍半！精度不减还能加速2倍

大模型同样的上下文窗口，只需一半内存就能实现，而且精度无损？前苹果ASIC架构师Nils Graef，和一名UC伯克利在读本科生一起提出了新的注意力机制Slim Attention。

来自主题: AI资讯

6289 点击 2025-03-17 19:52