AI资讯新闻榜单内容搜索-SAGE

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: SAGE
清华SageAttention3,FP4量化5倍加速!且首次支持8比特训练

清华SageAttention3,FP4量化5倍加速!且首次支持8比特训练

清华SageAttention3,FP4量化5倍加速!且首次支持8比特训练

随着大型模型需要处理的序列长度不断增加,注意力运算(Attention)的时间开销逐渐成为主要开销。

来自主题: AI技术研报
7126 点击    2025-06-19 10:47
红杉合伙人:使用数据(Usage)才是 AI 时代的护城河

红杉合伙人:使用数据(Usage)才是 AI 时代的护城河

红杉合伙人:使用数据(Usage)才是 AI 时代的护城河

护城河是所有投资人和创始人都非常关注的一个概念,因为它涉及到企业的长期价值和生死存亡。AI 时代,大家对护城河同样有执念,但是越来越搞不懂什么才是这个时代的护城河了,甚至是否还有护城河都已经是一个问题。

来自主题: AI资讯
6697 点击    2025-03-29 09:45
4比特量化三倍加速不掉点!清华即插即用的SageAttention迎来升级

4比特量化三倍加速不掉点!清华即插即用的SageAttention迎来升级

4比特量化三倍加速不掉点!清华即插即用的SageAttention迎来升级

大模型中,线性层的低比特量化已经逐步落地。然而,对于注意力模块,目前几乎各个模型都还在用高精度(例如 FP16 或 FP32)的注意力运算进行训练和推理。并且,随着大型模型需要处理的序列长度不断增加,Attention(注意力运算)的时间开销逐渐成为主要开销。

来自主题: AI技术研报
6651 点击    2024-12-27 09:44
又快又准,即插即用!清华8比特量化Attention,两倍加速于FlashAttention2,各端到端任务均不掉点!

又快又准,即插即用!清华8比特量化Attention,两倍加速于FlashAttention2,各端到端任务均不掉点!

又快又准,即插即用!清华8比特量化Attention,两倍加速于FlashAttention2,各端到端任务均不掉点!

又快又准,即插即用!清华8比特量化Attention,两倍加速于FlashAttention2,各端到端任务均不掉点!

来自主题: AI技术研报
8646 点击    2024-10-19 14:15
鹅厂造了个AI翻译公司:专攻网络小说,自动适配语言风格,真人和GPT-4看了都说好

鹅厂造了个AI翻译公司:专攻网络小说,自动适配语言风格,真人和GPT-4看了都说好

鹅厂造了个AI翻译公司:专攻网络小说,自动适配语言风格,真人和GPT-4看了都说好

鹅厂搞了个150多人的“翻译公司”,从老板到员工都是AI智能体! 主营业务是翻译网络小说,质量极高,参与评价的读者认为比真人翻译得还要好。 而且相比于雇佣真人,用它来翻译文学作品,成本降低了近80倍。

来自主题: AI技术研报
9941 点击    2024-05-25 18:41
曝苹果自研大模型Ajax新进展,改造Siri等全系应用,推出文本摘要工具

曝苹果自研大模型Ajax新进展,改造Siri等全系应用,推出文本摘要工具

曝苹果自研大模型Ajax新进展,改造Siri等全系应用,推出文本摘要工具

据AppleInsider 5月3日报道,苹果正在计划为其系统组件引入一系列AI增强功能,其中Safari、Messages、Mail、Spotlight Search和Siri将成为首批接受AI升级的应用。

来自主题: AI资讯
8241 点击    2024-05-08 19:00