AI技术研报-这里有最前沿的人工智能技术解读

ICML 2026｜从「鉴伪」到「修复」，AI图像取证进入闭环时代

对于 AI 生成图像中可能存在的不自然伪影，我们是否不仅能够将其定位和解释，还能进一步对其进行修复，使图像恢复为更加真实、自然的视觉外观？围绕这一问题，来自北京大学等机构的研究者提出了 GenShield：一个统一的自回归框架，将 AI 生成图像检测与图像伪影修复结合到同一个闭环中，实现从 “诊断” 到 “修复” 的一体化建模。

来自主题: AI技术研报

8140 点击 2026-06-21 10:31

深入理解 Claude Code：从 CLAUDE.md 到 Hooks、Skills、Subagents..

在常规的对话外，Claude Code（也可以是 Codex）其实还提供了一些别样的控制（或者说：上下文注入）方法，比如：CLAUDE.md、Rules、Skills、Subagents、Hooks、Output Styles、以及 System Prompt Append

来自主题: AI技术研报

10520 点击 2026-06-21 00:03

LLM终于学会推公式了！博世x清华推出FunctionEvolve：LLM-SRBench提升3.6倍，AI-Feynman满分

来自博世中央研究院与清华大学的研究人员提出 FunctionEvolve 框架，在两大基准测试上大幅刷新了这项任务的结果。在 LLM-SRBench 的 129 个合成科学方程任务上，FunctionEvolve 最终给出的公式在 55.8% 的任务上与真实公式等价（SA@1 = 72/129），是此前最好结果的 3.6 倍；

来自主题: AI技术研报

7809 点击 2026-06-20 10:24

碰撞暴降45.5%、200km 0接管！港大团队：自动驾驶真正的突破不在预训练，在后训练

香港大学李弘扬团队联合华为、上海创智学院及清华大学李升波教授团队，发表的最新论文World Engine: Towards the Era of Post-Training for Autonomous Driving给出了系统回答。

来自主题: AI技术研报

8443 点击 2026-06-20 10:24

ICML 2026｜Agent通讯的「运营商」哪家强？UIUC团队发布ProtocolBench

多智能体系统正在从学界走向业界。在 Coding、Research 等真实场景里，越来越多系统不再只依赖单个 agent，而是由多个 Agent 分工协作：有人负责规划，有人负责检索，有人调用工具，

来自主题: AI技术研报

8619 点击 2026-06-20 10:21

快手开源GoLongRL：23K样本、9大任务类型，长上下文RL荒的时代结束了

本研究由快手科技语言大模型团队完成，核心作者吕民轩、梅铁桦、杜坦隆等。快手科技与中国科学院大学联合提出 GoLongRL，一套完全开源的长上下文强化学习后训练方案，包含 23K 样本 RLVR 数据集

来自主题: AI技术研报

7946 点击 2026-06-20 10:21

全员本科生！何恺明组新作：文生图，258M参数就够了

全员本科生！刚刚，何恺明携本科生“军团”又放出一篇新论文。

来自主题: AI技术研报

10269 点击 2026-06-19 10:44

Kimi Work 推出目标模式：连肝 24 小时做了本漫画书，已开源

自从上次介绍过 Kimi Work 外加 Fable 无情下线之后，我发现我还真越来越频繁地在使用这个桌面端 APP 了。当然模型能力只是一方面，关键桌面 APP 比起网页来说，在使用上还是要方便得太多了……而且也不用关心网络切来切去啥的。

来自主题: AI技术研报

10116 点击 2026-06-19 10:18

Zvec 完全指南：从概念到实践

阿里开源的生产级向量数据库，跑在进程里，亿级数据毫秒响应

来自主题: AI技术研报

10955 点击 2026-06-19 10:16

ICML 2026 Oral | 为3D空间智能数据构建全自动数据飞轮，Holi-Spatial打造400万级空间多模态数据集

从原始视频出发，无需人工介入，自动生成 3D 重建、深度、2D mask、3D 框、实例描述、3D grounding 和空间问答。Holi-Spatial 试图把「空间智能」的数据生产，推进到自动化、可扩展的新阶段。

来自主题: AI技术研报

6979 点击 2026-06-19 10:16

一个月拿下1500star，只因我们比MinerU多做了这件事

2026 年 5 月 7 日，我们把 Knowhere 的完整技术栈开源了。

来自主题: AI技术研报

10599 点击 2026-06-19 09:26

开源Skills｜搭建亚马逊动态关键词库系统，每天抓SSS级机会词

PD大促还有两个周就开始了，不知道做亚马逊的你们词库搭好了吗？

来自主题: AI技术研报

7728 点击 2026-06-19 09:26

Agent 记忆，我们全都理解错了？

在做 Agent Memory 工程化探索的这几个月里，我经常有种被概念淹没的窒息。图结构记忆、AutoMemory、做梦机制、各种层出不穷的 Memory 框架……整个技术社区似乎陷入了一种每遇到一个新场景就要发明一套新词汇的群体焦虑中。

来自主题: AI技术研报

8404 点击 2026-06-19 09:25

ICML 2026 Spotlight | AI隐私训练时，那个最难控制的「阀门」能自动调节吗？

近日，来自英国南安普顿大学（University of Southampton）和广州大学的研究者团队提出 SlaClip，一种用于差分隐私随机梯度下降（DP-SGD）[1] 的自适应梯度剪裁方法。

来自主题: AI技术研报

8332 点击 2026-06-19 09:24

RAG新SOTA，还在5亿条数据上跑进秒级，只有它了

广州智跃深空人工智能科技有限公司 Zleap AI 提出的 SAG（SQL-Retrieval Augmented Generation）出场了。其实，名字已经点题了——不是 Graph、Hippo，而是 SQL-Retrieval。它的核心想法是在离线阶段，SAG 先把原始文本先整理成「事项 + 实体」的数据库结构。等查询来了，再围绕当前问题，用 SQL 动态串出一张局部线索网。

来自主题: AI技术研报

9045 点击 2026-06-18 16:58

NVIDIA团队让编程Agent接管真实机器人实验，成功率达99%

自动化研究，这一次真正走出代码沙盒，进入了真实的物理世界。

来自主题: AI技术研报

9334 点击 2026-06-18 16:31

3B小模型，编程得分比肩Opus 4.5，神秘模型引发热议，原是国产

最近几天，一个 3B 的小模型在 X 上火了，因为在一些难度可验证的推理任务上（比如编程），它进入了 Gemini 3 Pro、GPT-5 high、Claude Opus 4.5、GLM-5、Kimi K2.5 等前沿模型的性能区间，而它的体积远小于这些模型。

来自主题: AI技术研报

10803 点击 2026-06-18 15:30

2天手搓商业级App！开源GLM-5.2+Image2太绝了～【附教程】

大家好，我是袋鼠帝。如果你家的猫狗真的能说话，它们开口第一句会说什么？

来自主题: AI技术研报

10191 点击 2026-06-18 15:29

干掉 Whisper：我把 VoiceVault 迁移到 FunASR，本地转录加总结爽的飞起，已然是一枚离线录音加待办神器

把 VoiceVault 的转录引擎从 Whisper 迁移到 FunASR（sherpa-onnx），中文识别速度提升 3x，不再需要 500MB 的模型文件。但"切个后端"这件听起来很简单的事，让我在 GitHub Release 的 404、Tauri 白屏、trait object 生命周期和 CSP 策略里翻滚了一整天。

来自主题: AI技术研报

6249 点击 2026-06-18 15:28

英伟达GEAR实验室刚刚放出大招，物理世界的自动研究 AutoResearch 首次成为现实

AutoResearch这个词关注AI的同学应该不陌生，大神Andrej Karpathy提出的Agent 自主科研项目，现在已经是GitHub的明星项目了，应用不计其数。

来自主题: AI技术研报

8443 点击 2026-06-18 15:04

开源版AI虚拟主播来了，完全离线运行

还记得那个火爆全球的 AI Vtuber neuro-sama 吗？一个能实时和观众互动的 AI 虚拟主播。

来自主题: AI技术研报

9014 点击 2026-06-18 12:00

谷歌突然开源Agent OKF新标准！Karpathy力推的AI知识库终于有了通用格式了

谷歌今天发布了一个叫 Open Knowledge Format（OKF）的开放规范。

来自主题: AI技术研报

9493 点击 2026-06-18 11:27

腾讯混元最新开源：一套RL框架打通多个模态，庞天宇团队新作

大语言模型的RL技术已日趋成熟，多模态生成模型的强化学习训练却仍在“各自为战”——图像扩散模型一套流程、视频生成另一套标准、VLM和LLM又有不同的技术栈。

来自主题: AI技术研报

7714 点击 2026-06-18 11:25

李飞飞刚立规矩才13天，国产卡上「真物理」就来了！

被算力荒逼出来的硬核奇迹！腾讯米哈游老兵组成的「草根」团队，硬在国产芯片上炼出了超10分钟的绝对物理一致性。画面可以糙，物理绝不能假，这就是通往AGI的真正基石。

来自主题: AI技术研报

8138 点击 2026-06-17 15:05

达摩院发布世界模型评测基准，自家模型一个都没上榜......

达摩院联合高校推出WorldOlympiad评测基准，跳出传统视频“唯画质”的评价逻辑，以物理真实性、三维几何一致性、长时序交互保真度三大维度，搭配游戏、机器人、通用实景三大场景，打造一套全方位的视频世界模型评测体系。

来自主题: AI技术研报

9593 点击 2026-06-17 14:28

蚂蚁EGSS算法破解Test Time Scaling困局 | ACL 2026

更聪明的计算远比更多的计算更有效。

来自主题: AI技术研报

6960 点击 2026-06-17 14:06

ICML 2026 | 大模型为什么算不对加法？南大团队提出等本位和轨迹，揭示LLM算术错误的几何机制

尽管大语言模型（Large Language Models, LLMs）在复杂数学推理、代码生成和知识问答上表现突出，但它们仍常在多位数加法这类基础算术任务上犯错。

来自主题: AI技术研报

7733 点击 2026-06-17 14:05

ICML 2026 | Agentic强化学习训练的信息自锁问题

随着大语言模型逐步从「单轮问答」走向「真实环境中的持续交互」，LLM agents 正在被用于越来越复杂的 agentic applications：deep research、coding、computer use、customer service、medical inquiry、troubleshooting 等等。

来自主题: AI技术研报

6416 点击 2026-06-17 14:05

如何用 6 倍速 Kimi K2.7 Code，做「小红书端到端排版 Skill」？

昨天 Kimi K2.7 Code 高速版上线了，我上手试了下，最大的感受就一个字：快。

来自主题: AI技术研报

9982 点击 2026-06-17 10:52

王梦迪、丛乐团队Science Earth：当组织本身开始涌现，全球科学能力第一次在同一张网上互相发现

过去一年，由斯坦福大学丛乐（Le Cong）与普林斯顿大学王梦迪（Mengdi Wang）领衔的AI科研团队，一直在做同一件事：把越来越多的异质能力，纳入同一个协同视野。

来自主题: AI技术研报

6069 点击 2026-06-17 10:32