AI资讯新闻榜单内容搜索-自回归

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 自回归
ICML 2026|从「鉴伪」到「修复」,AI图像取证进入闭环时代

ICML 2026|从「鉴伪」到「修复」,AI图像取证进入闭环时代

ICML 2026|从「鉴伪」到「修复」,AI图像取证进入闭环时代

对于 AI 生成图像中可能存在的不自然伪影,我们是否不仅能够将其定位和解释,还能进一步对其进行修复,使图像恢复为更加真实、自然的视觉外观?围绕这一问题,来自北京大学等机构的研究者提出了 GenShield:一个统一的自回归框架,将 AI 生成图像检测 与 图像伪影修复 结合到同一个闭环中,实现从 “诊断” 到 “修复” 的一体化建模。

来自主题: AI技术研报
7709 点击    2026-06-21 10:31
Mythos阴影里谷歌悄悄发模型DiffusionGemma,速度暴涨4倍

Mythos阴影里谷歌悄悄发模型DiffusionGemma,速度暴涨4倍

Mythos阴影里谷歌悄悄发模型DiffusionGemma,速度暴涨4倍

就在刚刚,谷歌闷头干了件大事:把生成图片的扩散模型,拿来写文字了,而且一出手就是4倍加速。 新模型名为DiffusionGemma,它直接抛弃了传统自回归那套“逐Token生成”的打字机模式,而是像“印刷机”一样工作——

来自主题: AI资讯
8665 点击    2026-06-11 15:27
RSS 2026|蚂蚁灵波提出首个自回归因果世界模型,50条数据解锁通用机器人操控

RSS 2026|蚂蚁灵波提出首个自回归因果世界模型,50条数据解锁通用机器人操控

RSS 2026|蚂蚁灵波提出首个自回归因果世界模型,50条数据解锁通用机器人操控

赋予机器人物理理解和预测能力是通用操作的关键。蚂蚁灵波等机构提出的 LingBot-VA 试图将视频帧预测与动作推理统一起来,让机器人通过自回归扩散框架学会“一边思考一边行动”。

来自主题: AI技术研报
10531 点击    2026-06-04 09:13
22.9倍加速!FlashAR:仅用0.05%数据,让预训练好的自回归图像模型飞起来

22.9倍加速!FlashAR:仅用0.05%数据,让预训练好的自回归图像模型飞起来

22.9倍加速!FlashAR:仅用0.05%数据,让预训练好的自回归图像模型飞起来

来自浙江大学和阿德莱德大学的研究团队提出了 FlashAR—— 一个轻量级的后训练加速框架。不需要从头训练,在 Emu3.5-Image-34B 模型上,仅用原始训练数据的 0.05%(约 8 万张图片),就能将预训练好的自回归模型改造成高度并行的生成器 Emu3.5-34B-Flash,实现最高 22.9 倍的端到端加速。

来自主题: AI技术研报
8699 点击    2026-05-24 10:07
首个三模式大语言模型:4倍token吞吐量,长文本秒级时代要来了?

首个三模式大语言模型:4倍token吞吐量,长文本秒级时代要来了?

首个三模式大语言模型:4倍token吞吐量,长文本秒级时代要来了?

英伟达提出了全球首个三模式的大语言模型系列,只需简单更改注意力模式 / 掩码,即可在自回归、扩散和自推测解码之间切换。一个模型,三种解码模式,没有额外的草稿模型,没有架构变更。最快的模式 token 吞吐量能提升 4 倍。

来自主题: AI技术研报
9540 点击    2026-05-22 15:33
挑战扩散自回归统治!字节提出视觉生成第三种路线,让模型像人类一样边画边改

挑战扩散自回归统治!字节提出视觉生成第三种路线,让模型像人类一样边画边改

挑战扩散自回归统治!字节提出视觉生成第三种路线,让模型像人类一样边画边改

ber!这个五一假期,我也是真够忙的: 自拍、电影、追剧、街头采访、听音乐会,还抽空回老家结了次婚……

来自主题: AI技术研报
9884 点击    2026-05-14 09:31
ICML 2026 Spotlight| 拒绝盲目猜token,阿里x浙大将投机解码带入弹性预算时代

ICML 2026 Spotlight| 拒绝盲目猜token,阿里x浙大将投机解码带入弹性预算时代

ICML 2026 Spotlight| 拒绝盲目猜token,阿里x浙大将投机解码带入弹性预算时代

随着大模型参数规模持续扩大,推理成本已经成为生产级 LLM 服务的核心瓶颈。投机解码(Speculative Decoding, SD)通过「小模型 draft + 大模型 verify」的方式,将多个候选 token 放到一次目标模型前向中并行验证,从而缓解自回归解码的串行瓶颈。

来自主题: AI技术研报
8447 点击    2026-05-13 15:01
何恺明首个语言模型:105M参数,不走GPT自回归老路

何恺明首个语言模型:105M参数,不走GPT自回归老路

何恺明首个语言模型:105M参数,不走GPT自回归老路

何恺明,也下场做语言模型了。

来自主题: AI技术研报
9007 点击    2026-05-13 10:47
从训练到推理的「瘦身」演进:首篇高效扩散语言模型(dLLM)深度综述

从训练到推理的「瘦身」演进:首篇高效扩散语言模型(dLLM)深度综述

从训练到推理的「瘦身」演进:首篇高效扩散语言模型(dLLM)深度综述

在生成式 AI 的浪潮中,自回归(Autoregressive, AR)模型凭借其卓越的性能占据了统治地位。然而,其「从左到右」逐个预测 Token 的串行机制,天生限制了并行生成的可能性。

来自主题: AI技术研报
6850 点击    2026-03-10 14:29