AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
ICML 2026|文生图模型也会「忘词」?复旦创智等提出Prompt Reinjection,无需训练提升文生图指令遵循能力

ICML 2026|文生图模型也会「忘词」?复旦创智等提出Prompt Reinjection,无需训练提升文生图指令遵循能力

ICML 2026|文生图模型也会「忘词」?复旦创智等提出Prompt Reinjection,无需训练提升文生图指令遵循能力

近年来,文生图模型的能力快速提升。从 Stable Diffusion 到 FLUX、Qwen-Image,扩散模型已经能够生成高质量图像,也能处理越来越复杂的文本提示。

来自主题: AI技术研报
8989 点击    2026-06-09 10:02
解锁Agent Swarm新潜力,openJiuwen又一力作:多智能体流网络

解锁Agent Swarm新潜力,openJiuwen又一力作:多智能体流网络

解锁Agent Swarm新潜力,openJiuwen又一力作:多智能体流网络

多智能体协作对于解决复杂问题虽然具有巨大优势,但是其架构本质上易出现错误传播,因为由不正确的工作流生成或单智能体幻觉输出引起的错误会沿着协作链蔓延,影响最终结果。

来自主题: AI技术研报
9646 点击    2026-06-09 09:59
32B超越671B!M-A-P全开源数学定理证明模型OProver,五项评测三项第一

32B超越671B!M-A-P全开源数学定理证明模型OProver,五项评测三项第一

32B超越671B!M-A-P全开源数学定理证明模型OProver,五项评测三项第一

形式化定理证明,一直是LLM公认最严苛的推理试金石,每一步推导都必须通过Lean 4内核的机器验证。

来自主题: AI技术研报
7208 点击    2026-06-09 09:37
Coding Agent 技术全景图:Context Engineering、Subagents 与 Harness,一年范式转移全解析

Coding Agent 技术全景图:Context Engineering、Subagents 与 Harness,一年范式转移全解析

Coding Agent 技术全景图:Context Engineering、Subagents 与 Harness,一年范式转移全解析

一年前,行业还在为“从自动补全到 Agent”的进化感到兴奋。然而一年过去,我们不难发现单纯靠“Vibe Coding”和“Prompt 调优”,面对非确定性模型带来的风险和成本问题,显然无法撑起企业级软件开发。

来自主题: AI技术研报
6203 点击    2026-06-09 09:37
一件衣服「隐身」可见光-热成像检测器,清华多模态对抗新方法

一件衣服「隐身」可见光-热成像检测器,清华多模态对抗新方法

一件衣服「隐身」可见光-热成像检测器,清华多模态对抗新方法

清华大学提出一种新型物理对抗方法,利用特殊服装同时干扰可见光和热成像检测。这种服装通过非重叠设计和三维建模优化,可有效躲避RGB-T检测器,促进系统安全性研究。

来自主题: AI技术研报
7514 点击    2026-06-09 09:37
刚刚,Mind Lab开源V1系列模型Preview,749B参数,专为Agent 后训练

刚刚,Mind Lab开源V1系列模型Preview,749B参数,专为Agent 后训练

刚刚,Mind Lab开源V1系列模型Preview,749B参数,专为Agent 后训练

过去一个多月,大模型圈依旧热闹。从 GPT-5.5、DeepSeek V4 到 Claude Opus 4.8,后训练正在成为模型能力提升的关键引擎。

来自主题: AI技术研报
5485 点击    2026-06-08 15:29
一个8×8矩阵,让大模型「记住」长对话:Mind Lab联合NTU、复旦推出δ-mem,参数仅0.12%

一个8×8矩阵,让大模型「记住」长对话:Mind Lab联合NTU、复旦推出δ-mem,参数仅0.12%

一个8×8矩阵,让大模型「记住」长对话:Mind Lab联合NTU、复旦推出δ-mem,参数仅0.12%

不扩上下文窗口、不换骨干架构、不做全参数微调 —— 只需要一个 8×8 的在线状态矩阵,就能让冻结的 Transformer 拥有真正的长期记忆。

来自主题: AI技术研报
9531 点击    2026-06-08 14:50
废片也能变大片!北大开源首个「美学照片重构」模型 | ICML'26

废片也能变大片!北大开源首个「美学照片重构」模型 | ICML'26

废片也能变大片!北大开源首个「美学照片重构」模型 | ICML'26

北大彭宇新团队提出「美学照片重构」新任务,从摄影教学视频中自动构建数据集AesRecon,并开发两阶段模型AesFormer,通过优化构图、视角与人物姿态,提升照片的美感与艺术表现力。

来自主题: AI技术研报
9736 点击    2026-06-08 14:49
连续入选ICRA最佳论文,RoboScience机器科学如何突破具身智能泛化瓶颈?

连续入选ICRA最佳论文,RoboScience机器科学如何突破具身智能泛化瓶颈?

连续入选ICRA最佳论文,RoboScience机器科学如何突破具身智能泛化瓶颈?

在具身智能最难的泛化问题上,他们连续拿出顶会级成果,并把它们沉淀进其创新 VLOA 大模型,推动机器人迈向广阔现实。

来自主题: AI技术研报
8773 点击    2026-06-08 10:45
诺奖得主联手Claude,40轮对话证出12年物理猜想

诺奖得主联手Claude,40轮对话证出12年物理猜想

诺奖得主联手Claude,40轮对话证出12年物理猜想

一道悬了12年没人证出来的物理猜想,诺贝尔物理学奖得主Giorgio Parisi把它交给了Claude,模型几乎自己推出了完整证明。

来自主题: AI技术研报
7108 点击    2026-06-08 10:13
ICML 2026|让 Agent 真正协同作战:GoS 为多智能体推理构建共享信念状态

ICML 2026|让 Agent 真正协同作战:GoS 为多智能体推理构建共享信念状态

ICML 2026|让 Agent 真正协同作战:GoS 为多智能体推理构建共享信念状态

近年来,大语言模型在数学、代码等任务上的表现不断刷新上限,但到了医疗诊断、故障排查这类真实世界任务里,真正困难的是让多个智能体在不确定的动态环境中持续协作推理。

来自主题: AI技术研报
9417 点击    2026-06-08 09:48
ICML 2026|FusionRoute:从专家路由到自我修正,一种新的多LLM协作范式

ICML 2026|FusionRoute:从专家路由到自我修正,一种新的多LLM协作范式

ICML 2026|FusionRoute:从专家路由到自我修正,一种新的多LLM协作范式

近年来,大语言模型能力的提升,已不再仅仅依赖于更大的模型规模或更多的训练数据。越来越多的研究开始探索另一条路径:通过多个专家模型的协作来完成生成任务。

来自主题: AI技术研报
9633 点击    2026-06-08 09:47
37万次真实会话实测Agent榜单:GPT-5.5High第一,Claude最稳,真实干活能力看这五项核心指标

37万次真实会话实测Agent榜单:GPT-5.5High第一,Claude最稳,真实干活能力看这五项核心指标

37万次真实会话实测Agent榜单:GPT-5.5High第一,Claude最稳,真实干活能力看这五项核心指标

6月4日,Arena.ai发布Agent Arena排行榜,用373,431次真实会话的数据,给18个主流模型的Agent能力排了个座次。先看总榜。Agent Arena的排名依据是“净改进”(Net Improvement),用因果推断方法算出每个模型相对于随机基线的性能提升幅度。正值代表比随机选择更好,负值说明不如随机。

来自主题: AI技术研报
8813 点击    2026-06-07 14:38
DeepSeek V4做数学证明,500倍成本优势:智能体系统刷新多项纪录

DeepSeek V4做数学证明,500倍成本优势:智能体系统刷新多项纪录

DeepSeek V4做数学证明,500倍成本优势:智能体系统刷新多项纪录

近日,普林斯顿大学的研究团队发布了一篇新论文,提出了一个名为 Goedel-Architect 的智能体框架。他们用的核心模型,是国内开源大模型 DeepSeek-V4-Flash。

来自主题: AI技术研报
8056 点击    2026-06-07 10:56
大晓机器人联合南洋理工打通Physical AI全链路!PhysX-Omni补齐物理AI基建

大晓机器人联合南洋理工打通Physical AI全链路!PhysX-Omni补齐物理AI基建

大晓机器人联合南洋理工打通Physical AI全链路!PhysX-Omni补齐物理AI基建

该论文第一作者为曹子昂,研究方向主要聚焦于 3D AIGC、Physical AI 与具身智能。论文主要合作者包括来自南洋理工大学的李海天、姚润茂、洪方舟、陈昭熹,以及大晓机器人的刘英豪和潘亮。通讯作者为南洋理工大学刘子纬教授。

来自主题: AI技术研报
8012 点击    2026-06-07 10:55
CVPR 2026|LLM会写3D视觉代码吗?清华联合智源用GeoCodeBench给出答案

CVPR 2026|LLM会写3D视觉代码吗?清华联合智源用GeoCodeBench给出答案

CVPR 2026|LLM会写3D视觉代码吗?清华联合智源用GeoCodeBench给出答案

近日,来自清华大学智能产业研究院(AIR)的团队联合北京智源研究院(BAAI)、北京大学、南京大学等机构构建了一个基准:GeoCodeBench。这是一个面向 3D 几何计算机视觉的 PhD 级 coding benchmark,

来自主题: AI技术研报
8838 点击    2026-06-07 10:54
重写《给阿嬷的情书》结局:哈工大张民团队联合阿里开源全流程AI多智能体导演框架VideoClaw

重写《给阿嬷的情书》结局:哈工大张民团队联合阿里开源全流程AI多智能体导演框架VideoClaw

重写《给阿嬷的情书》结局:哈工大张民团队联合阿里开源全流程AI多智能体导演框架VideoClaw

早在 2023 年大模型快速发展期,哈工大张民教授立知大模型团队已开展多模态大模型驱动的视频内容创作智能体研究,并全球首发开源了电影制作智能体 FilmAgent 与动画片生成智能体 Anim-Director,受到国内外智能体研究者与文艺创作者的广泛关注。

来自主题: AI技术研报
7288 点击    2026-06-07 10:51
快手可灵提出VLM-as-Teacher:用测试时在线优化,让视频生成模型学会按规则推理

快手可灵提出VLM-as-Teacher:用测试时在线优化,让视频生成模型学会按规则推理

快手可灵提出VLM-as-Teacher:用测试时在线优化,让视频生成模型学会按规则推理

怎么让VGM学会按规则推理?过去主要有两条路。两条路,一个不动模型,一个只写文字,都没真正解决“执行”问题。为此,城大×快手可灵提出了第三条路:VLM-as-Teacher。

来自主题: AI技术研报
7523 点击    2026-06-06 09:51
超越Figure AI!全球首个机器人训练楼盘开盘:30万套中国住宅,机器人拎包入住

超越Figure AI!全球首个机器人训练楼盘开盘:30万套中国住宅,机器人拎包入住

超越Figure AI!全球首个机器人训练楼盘开盘:30万套中国住宅,机器人拎包入住

一觉睡醒,具身智能公司竟然也开始搞房地产了?!刚刚,大晓机器人联合港中文MMLab发布了一个新项目——Kairos-Homeworld,全球首个实现全屋三维生成与物体级全交互的统一框架。

来自主题: AI技术研报
7591 点击    2026-06-06 09:47
单卡10秒级!计算所联合ETH单图3D化新研究:同质量生成提速2.67倍

单卡10秒级!计算所联合ETH单图3D化新研究:同质量生成提速2.67倍

单卡10秒级!计算所联合ETH单图3D化新研究:同质量生成提速2.67倍

来自中国科学院计算技术研究所、ETH Zurich等机构的研究者提出了Fast-SAM3D。该方法直接面向SAM3D的推理链路做训练无关加速,在最大程度保持重建质量的同时,将单对象生成提速最高2.67倍,场景生成提速最高2.01倍。

来自主题: AI技术研报
7857 点击    2026-06-06 09:45
阶跃Step 3.7 Flash登顶AA榜:速度、性价比、端到端三项第一

阶跃Step 3.7 Flash登顶AA榜:速度、性价比、端到端三项第一

阶跃Step 3.7 Flash登顶AA榜:速度、性价比、端到端三项第一

OpenRouter Trending榜单冷不丁窜出一匹国产黑马,热度暴涨稳居全球第二。

来自主题: AI技术研报
9057 点击    2026-06-05 09:55
超越TurboQuant:Together AI把2-bit KV Cache推向真实服务

超越TurboQuant:Together AI把2-bit KV Cache推向真实服务

超越TurboQuant:Together AI把2-bit KV Cache推向真实服务

长上下文模型越来越能“记”,但真正让它们跑到线上时,最先顶不住的往往不是算力,而是KV Cache。

来自主题: AI技术研报
5342 点击    2026-06-05 09:53
「这可能是人类写的最后一篇论文」Stanford、Michigan、CMU 等 37 位学者联手:把论文从 PDF 改写成 AI 能直接执行的研究包

「这可能是人类写的最后一篇论文」Stanford、Michigan、CMU 等 37 位学者联手:把论文从 PDF 改写成 AI 能直接执行的研究包

「这可能是人类写的最后一篇论文」Stanford、Michigan、CMU 等 37 位学者联手:把论文从 PDF 改写成 AI 能直接执行的研究包

我们今天以 PDF 写论文的方式,已经持续了三百多年。然而论文其实是把一段混乱反复、充满试错的真实研究,讲成一个干净利落、足以服人的完美故事。

来自主题: AI技术研报
9587 点击    2026-06-05 09:25
微软最新提出SkillOpt,用训练大模型的方法优化你的Agent Skills

微软最新提出SkillOpt,用训练大模型的方法优化你的Agent Skills

微软最新提出SkillOpt,用训练大模型的方法优化你的Agent Skills

训练大模型时,工程师绝对不会指望网络做一次前向传播就能收敛。它需要数据喂养、Batch切分、学习率控制、验证集筛选以及优化器状态的迭代试错。

来自主题: AI技术研报
9739 点击    2026-06-05 09:13