AI资讯新闻榜单内容搜索-FP4

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: FP4
清华SageAttention3,FP4量化5倍加速!且首次支持8比特训练

清华SageAttention3,FP4量化5倍加速!且首次支持8比特训练

清华SageAttention3,FP4量化5倍加速!且首次支持8比特训练

随着大型模型需要处理的序列长度不断增加,注意力运算(Attention)的时间开销逐渐成为主要开销。

来自主题: AI技术研报
7141 点击    2025-06-19 10:47
黄仁勋问答全文:关于中国市场、全球供应链、奥特曼和Groq

黄仁勋问答全文:关于中国市场、全球供应链、奥特曼和Groq

黄仁勋问答全文:关于中国市场、全球供应链、奥特曼和Groq

今年GTC大会上,英伟达推出了地表最强Blackwell计算平台、NIM推理微服务、Omniverse Cloud API等惊喜新品。其中Blackwell GPU具有2080亿个晶体管,AI算力直接暴涨30倍。单芯片训练性能(FP8)是Hopper架构的2.5 倍,推理性能(FP4)是Hopper架构的5倍。具有第5代NVLink互连,并且可扩展至576个GPU。

来自主题: AI资讯
5782 点击    2024-03-22 16:04