AI资讯新闻榜单内容搜索-FP4

英伟达AI超算3999开售，「掌心之中」可部署所有大参数开源模型！

英伟达面向个人的AI超算DGX Spark已上市！128GB统一内存（常规系统内存+GPU显存），加上允许将两台DGX Spark连起来，直接可以跑起来405B的大模型（FP4精度），而这已经逼近目前开源的最大模型！如此恐怖的实力却格外安静优雅，大小与Mac mini相仿，3999美元带回家！

来自主题: AI资讯

8076 点击 2025-10-14 22:34

DeepSeek刚提到FP8，英伟达就把FP4精度推向预训练，更快、更便宜

前些天，DeepSeek 在发布 DeepSeek V3.1 的文章评论区中，提及了 UE8M0 FP8 的量化设计，声称是针对即将发布的下一代国产芯片设计。

来自主题: AI资讯

7269 点击 2025-08-28 15:40

清华第三代Sage注意力发布！提速5倍，精度不降，训推都能用

清华大学朱军教授团队提出SageAttention3，利用FP4量化实现推理加速，比FlashAttention快5倍，同时探索了8比特注意力用于训练任务的可行性，在微调中实现了无损性能。

来自主题: AI技术研报

6897 点击 2025-07-08 12:08

清华SageAttention3，FP4量化5倍加速！且首次支持8比特训练

随着大型模型需要处理的序列长度不断增加，注意力运算（Attention）的时间开销逐渐成为主要开销。

来自主题: AI技术研报

7934 点击 2025-06-19 10:47

大模型训练开销还能更小！微软推出首个FP4训练框架，训练效果与BF16相当

首个FP4精度的大模型训练框架来了，来自微软研究院！

来自主题: AI技术研报

7872 点击 2025-01-30 15:11

英伟达迷你超算遭友商嘲讽：宣传FP4算力，实际“不如买个游戏电脑”

老黄在CES上发布的迷你超算Project DIGITS，开启了AI超算的PC时刻。但随即也引发了不小争议，还遭到了大佬的贴脸嘲讽。

来自主题: AI资讯

7807 点击 2025-01-10 16:10

黄仁勋问答全文：关于中国市场、全球供应链、奥特曼和Groq

今年GTC大会上，英伟达推出了地表最强Blackwell计算平台、NIM推理微服务、Omniverse Cloud API等惊喜新品。其中Blackwell GPU具有2080亿个晶体管，AI算力直接暴涨30倍。单芯片训练性能（FP8）是Hopper架构的2.5 倍，推理性能（FP4）是Hopper架构的5倍。具有第5代NVLink互连，并且可扩展至576个GPU。

来自主题: AI资讯

6573 点击 2024-03-22 16:04