AI资讯新闻榜单内容搜索-SAG

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: SAG
比全球最强推理引擎还快2倍,斯坦福、普林斯顿破解大模型「串行魔咒」

比全球最强推理引擎还快2倍,斯坦福、普林斯顿破解大模型「串行魔咒」

比全球最强推理引擎还快2倍,斯坦福、普林斯顿破解大模型「串行魔咒」

在大语言模型推理领域,虽然「推测解码」(Speculative Decoding,SD)已成为加速生成的标准配置,但它依然存在一个致命弱点: drafting(草拟)和 verification(验证)之间必须串行进行。

来自主题: AI技术研报
7386 点击    2026-04-01 16:20
顶尖模型离“科学家”还差得远?AI4S亟待迈向2.0时代

顶尖模型离“科学家”还差得远?AI4S亟待迈向2.0时代

顶尖模型离“科学家”还差得远?AI4S亟待迈向2.0时代

周伯文还详细介绍了上海 AI 实验室近年来开展的前沿探索与实践,包括驱动 “通专融合” 发展的技术架构 ——“智者”SAGE(Synergistic Architecture for Generalizable Experts),其包含基础、融合与进化三个层次,并可双向循环实现全栈进化;支撑 AGI4S 探索的两大基础设施“书生”科学多模态大模型 Intern-S1、“

来自主题: AI资讯
9706 点击    2026-01-30 19:13
具身智能老炮再获数亿融资,移动多臂机器人已批量工业落地

具身智能老炮再获数亿融资,移动多臂机器人已批量工业落地

具身智能老炮再获数亿融资,移动多臂机器人已批量工业落地

硬氪获悉,具身智能机器人公司飒智智能近期连续完成A++轮及A+++轮融资,累计金额达数亿元。我们总结了最新两轮融资信息和该公司几大亮点:

来自主题: AI资讯
10348 点击    2025-12-22 12:17
Zleap技术解密:后RAG时代已来,SAG重新定义AI搜索

Zleap技术解密:后RAG时代已来,SAG重新定义AI搜索

Zleap技术解密:后RAG时代已来,SAG重新定义AI搜索

大家好,我是Jomy,是智跃Zleap的CEO,也是Zleap产品和技术的主要设计者。此前在报道中,我曾粗略介绍过Zleap产品背后的技术:一个能帮助CEO自动整理、总结海量企业内部信息的智能Agent。今天,我要正式为大家介绍驱动这个Agent的底层技术:SAG。

来自主题: AI技术研报
10252 点击    2025-11-18 10:40
Claude Code生态指南:GitHub 上最热门的17个开源项目

Claude Code生态指南:GitHub 上最热门的17个开源项目

Claude Code生态指南:GitHub 上最热门的17个开源项目

我最开始接触Claude Code——这种「代理式终端编程工具」的时候,说实话,很不习惯 于是我安装了很多第三方工具来让它变得更好用,例如安装ccusage查看用量、安装Claudia把它变回 IDE等等

来自主题: AI资讯
10862 点击    2025-08-25 11:46
清华第三代Sage注意力发布!提速5倍,精度不降,训推都能用

清华第三代Sage注意力发布!提速5倍,精度不降,训推都能用

清华第三代Sage注意力发布!提速5倍,精度不降,训推都能用

清华大学朱军教授团队提出SageAttention3,利用FP4量化实现推理加速,比FlashAttention快5倍,同时探索了8比特注意力用于训练任务的可行性,在微调中实现了无损性能。

来自主题: AI技术研报
8523 点击    2025-07-08 12:08
Cursor定价风波:从“按次”到“按量”,官方致歉并退款!

Cursor定价风波:从“按次”到“按量”,官方致歉并退款!

Cursor定价风波:从“按次”到“按量”,官方致歉并退款!

2025年6月,AI 代码编辑器 Cursor 因定价模式调整引发广泛争议。原先的“按次计费”(per-request billing)改为基于 token 的“按量计费”(usage-based pricing),导致部分用户面临意外扣费,社区反馈强烈Cursor 于7月5日发布致歉声明,承诺退款并澄清新计费模式。

来自主题: AI资讯
13161 点击    2025-07-07 15:33
清华SageAttention3,FP4量化5倍加速!且首次支持8比特训练

清华SageAttention3,FP4量化5倍加速!且首次支持8比特训练

清华SageAttention3,FP4量化5倍加速!且首次支持8比特训练

随着大型模型需要处理的序列长度不断增加,注意力运算(Attention)的时间开销逐渐成为主要开销。

来自主题: AI技术研报
9413 点击    2025-06-19 10:47