AI资讯新闻榜单内容搜索-北京大学

ICML 2026 Spotlight | 直面「模态缺失」挑战：北大彭宇新团队联合福大柯逍团队提出LIMSSR，面向训练阶段不完整观测的精准评价

本文是北京大学彭宇新教授团队联合福州大学柯逍教授团队在细粒度多模态动作质量评价领域的最新研究成果，相关论文已被 ICML 2026 接收为 Spotlight，并已开源。真实世界中的多模态数据往往并不完整。在动作质量评价任务中，视频、光流、音频等模态能够从不同角度描述动作执行过程，但在实际采集时，传感器故障、环境噪声、隐私限制等因素都会导致模态缺失。

来自主题: AI技术研报

7852 点击 2026-07-10 10:40

蒸馏效果起飞！DOPD破解「特权幻觉」，让在线策略蒸馏更有效

最近，来自新加坡国立大学、香港中文大学 MMLab、北京大学和京东探索研究院的研究团队提出了一种全新的在线策略蒸馏方法: DOPD (Dual On-policy Distillation) ，通过优势感知的双重蒸馏范式，成功破解了这一难题。

来自主题: AI技术研报

7620 点击 2026-07-09 09:48

独家丨ACM戈登贝尔奖得主杨超领衔，北大系顶尖团队入局物理 AI 底层基建

独家获悉，一支北大出身、手握国际顶级超算成果的核心技术团队已完成市场化主体搭建，正式布局物理AI底层基础设施赛道。团队由北京大学杨超教授领衔，杨超是我国首位 ACM 戈登贝尔奖得主，2016 年带领团队拿下该国际超算最高荣誉，实现了我国在该奖项上零的突破；其本人也获评首届王选杰出青年学者奖，在高性能计算、数值仿真、人工智能等领域长期深耕。

来自主题: AI资讯

7561 点击 2026-07-04 14:12

AI Agent为什么总是不稳定？终于有了一个系统性基准来拆解

三星大模型团队联合北京大学、香港城市大学、香港科技大学等科研机构，共同发布了面向 AI Agent 的基准测试 LiveClawBench。它关注的并不是「谁的 Agent 更强」，而是一个更基础、也更关键的问题：为什么同一个 AI Agent，在一些任务中已经接近可用，而在另一些任务中却会突然失稳？

来自主题: AI技术研报

7395 点击 2026-07-04 10:50

ICML 2026｜从「鉴伪」到「修复」，AI图像取证进入闭环时代

对于 AI 生成图像中可能存在的不自然伪影，我们是否不仅能够将其定位和解释，还能进一步对其进行修复，使图像恢复为更加真实、自然的视觉外观？围绕这一问题，来自北京大学等机构的研究者提出了 GenShield：一个统一的自回归框架，将 AI 生成图像检测与图像伪影修复结合到同一个闭环中，实现从 “诊断” 到 “修复” 的一体化建模。

来自主题: AI技术研报

7882 点击 2026-06-21 10:31

CVPR 2026｜LLM会写3D视觉代码吗？清华联合智源用GeoCodeBench给出答案

近日，来自清华大学智能产业研究院（AIR）的团队联合北京智源研究院（BAAI）、北京大学、南京大学等机构构建了一个基准：GeoCodeBench。这是一个面向 3D 几何计算机视觉的 PhD 级 coding benchmark，

来自主题: AI技术研报

9436 点击 2026-06-07 10:54

北大发布全球首个「自进化」5D世界模型EvoPhys-World，基于摩尔线程全国产算力底座，以「人」为中心，实现场景级万物可控

近日，北京大学 EvoPhys 团队推出首个以 “人” 为中心的 “场景级万物可控” 5D 世界模型 EvoPhys-World，基于摩尔线程全国产算力底座，团队首次将 AI 生成世界从 “可观看、可漫游，浅交互” 的阶段，推进到 “可操纵、深交互、自进化” 的新阶段。

来自主题: AI资讯

9840 点击 2026-06-05 15:33

北大提出首个可验证的仓库级生成基准RepoZero，评测LLM能否从0生成一个代码仓库

投稿来自北京大学与百度联合团队，他们提出了首个面向“从零生成完整代码仓库”的评测基准 RepoZero，通过跨语言复现任务与自验证框架 ACE，推动代码补全更近一步迈向自动化软件工程。

来自主题: AI技术研报

8214 点击 2026-05-22 09:27

刚刚，DeepSeek多模态技术范式公布，以视觉原语思考

刚刚，DeepSeek 在 Github 上正式发布了多模态模型，公布了背后的技术报告。实打实的新鲜出炉！而且是开创性的推理范式。下面我们就基于 DeepSeek 这篇技术报告，具体看看 DeepSeek、北京大学、清华大学又创造了怎样的奇迹。

来自主题: AI技术研报

9709 点击 2026-04-30 20:24

ACL 2026｜答得更准还写得更短？华为泰勒实验室提出SHAPE，给LLM推理装了个「推理税」

来自华为泰勒实验室、北京大学和上海财经大学的研究团队提出了 SHAPE（Stage-aware Hierarchical Advantage via Potential Estimation），给推理链装上了一套「里程碑 + 推理税」机制——不仅告诉模型每一步推得对不对，还让它为啰嗦付出代价。结果是：准确率平均提升 3%，token 消耗直降 30%。

来自主题: AI技术研报

8342 点击 2026-04-30 12:12