AI技术研报-这里有最前沿的人工智能技术解读

告别「单线程」思维：通研院提出NPR框架，让智能体进化出原生的并行推理大脑

近年来，大语言模型在「写得长、写得顺」这件事上进步飞快。但当任务升级到真正复杂的推理场景 —— 需要兵分多路探索、需要自我反思与相互印证、需要在多条线索之间做汇总与取舍时，传统的链式思维（Chain-of-Thought）往往就开始「吃力」：容易被早期判断带偏、发散不足、自我纠错弱，而且顺序生成的效率天然受限。

来自主题: AI技术研报

10177 点击 2025-12-29 09:36

顶刊TPAMI｜多模态视频理解领域重磅数据更新：MeViSv2发布

近日，多模态视频理解领域迎来重磅更新！由复旦大学、上海财经大学、南洋理工大学联合打造的 MeViSv2 数据集正式发布，并已被顶刊 IEEE TPAMI 录用。

来自主题: AI技术研报

9492 点击 2025-12-29 09:07

华人一作！Meta等复刻AlphaZero神话，AI甩开人类自修成神

当模型学会「左右互搏」的那一刻，平庸的模仿时代结束了，真正的硅基编程奇迹刚刚开始。

来自主题: AI技术研报

9732 点击 2025-12-29 09:06

AI 真能看懂物理世界吗？FysicsWorld：填补全模态交互与物理感知评测的空白

近年来，多模态大语言模型正在经历一场快速的范式转变，新兴研究聚焦于构建能够联合处理和生成跨语言、视觉、音频以及其他潜在感官模态信息的统一全模态大模型。此类模型的目标不仅是感知全模态内容，还要将视觉理解和生成整合到统一架构中，从而实现模态间的协同交互。

来自主题: AI技术研报

8780 点击 2025-12-29 09:05

12毫秒暴露自动驾驶致命缺陷，北航新研究实现场景感知的动态物理对抗攻击｜TPAMI2025

近日，部分L3级自动驾驶车型已经通过工信部批准正式上路，这标志着这我国自动驾驶产业的新阶段。

来自主题: AI技术研报

6574 点击 2025-12-29 09:04

百万人围观，「上下文图谱」火了，万亿美元新机遇？

编辑｜张倩、陈陈当智能体（Agent）开始深度介入人类世界，关于豆包 AI 手机的讨论可能只是个开始。在此之前，手机、电脑软件都是给人用的 —— 人负责一步步操作，系统负责把信息存好、算好。但现在

来自主题: AI技术研报

8695 点击 2025-12-28 20:33

只剩1%的人在完全手写代码，近七成Vibe产品仅需一个月就可上线 | 2025中国Vibe创作生态报告发布

开发周期被打破了。曾需数月打磨的 MVP，如今近七成可在一个月内上线；曾需十人协作的产研流程，如今超七成由三人以下小团队完成。AI Coding 工具已不再是辅助，而是主力：仅 1% 的创作者仍完全手写代码，近六成将多数乃至全部编码交予 AI。效率的跃升前所未有，但随之而来的是一个尖锐的问题：快，是否等于有价值？

来自主题: AI技术研报

8619 点击 2025-12-27 10:54

训练时间爆砍80%！港大快手联合打造了一个AI炼金师：专挑“有营养”数据，20%数据达成50%效果

由香港大学丁凯欣领导，联合华南理工大学周洋以及快手科技Kling团队共同完成的这项研究，开发出了一个名为“炼金师”（Alchemist）的AI系统。它就像一位挑剔的大厨，能从海量图片数据中精准挑选出最有价值的一半。

来自主题: AI技术研报

7507 点击 2025-12-27 10:30

单卡2秒生成一个视频！清华联手生数开源TurboDiffusion，视频DeepSeek时刻来了

现在生成一个视频，比你刷视频还要快。

来自主题: AI技术研报

7338 点击 2025-12-26 10:58

上下文工程的Agent Skills来了，CC、Codex直接用，一周获2.3k star

GitHub上最近出现了一个非常火的项目Agent-Skills-for-Context-Engineering，发布不到一周就斩获了2.3k Stars。为什么它能瞬间引爆社区？因为站在2025年末的节点上，我们已经受够了那些只存在于大厂白皮书里的Context Engineering（上下文工程）理论。

来自主题: AI技术研报

7904 点击 2025-12-26 10:56

字节Seed发布最强数学模型：一招“打草稿”，IMO银牌变金牌

字节最新数学推理专用模型，刚刚刷新战绩：拿下IMO金牌成绩。

来自主题: AI技术研报

9755 点击 2025-12-26 10:34

物理学变天！「AI主导」论文首次登顶刊，人类科学家沦为验证者？

AI提供1%的灵感，人类提供99%汗水！密歇根州立大学物理学家许道辉，在AI启发下，重新思考量子力学本质，在顶刊《物理快报B》上发表了相关结论。

来自主题: AI技术研报

7468 点击 2025-12-26 10:12

一键生成出海营销数字人！GLM-4.7+Claude Code可以封神了～

大家好，我是被智谱卷到的袋鼠帝。昨天智谱刚把GLM-4.7放出来，群里就有老哥找我写文章了..

来自主题: AI技术研报

6521 点击 2025-12-26 10:11

客观聊聊 MiniMax 的新模型

前脚刚听完罗永浩和 MiniMax 创始人闫俊杰的超长播客，然后就看到 MiniMax M2.1 发布了。

来自主题: AI技术研报

9370 点击 2025-12-26 10:07

教程|别只盯着 Langchain！Google ADK 搭建 Agent，上下文管理效率翻倍

Agent 的状态数据分两种：会话内的临时上下文和跨会话的长期知识。

来自主题: AI技术研报

7590 点击 2025-12-26 09:43

《全载录丨Xsignal 全球AI应用行业年度报告丨2025》丨Xsignal深度文章

在生成式AI（GenAI）的推动下，2025年标志着行业从“震撼期”正式步入“深水区”。这并非资本的泡沫，而是计算范式从CPU向GPU的根本性迁移——数据中心正进化为实时生产智能的“AI工厂”。相比于模型参数的单纯竞赛，AI应用带来的“任务执行”能力与直观体验，让人切身感受到从“信息检索”向“智能生成”的范式跃迁。

来自主题: AI技术研报

8635 点击 2025-12-26 09:43

向量检索爆雷！傅聪联合浙大发布IceBerg Benchmark：HNSW并非最优，评估体系存在严重偏差

将多模态数据纳入到RAG，甚至Agent框架，是目前LLM应用领域最火热的主题之一，针对多模态数据最自然的召回方式，便是向量检索。

来自主题: AI技术研报

6634 点击 2025-12-26 09:40

超越谷歌，全球第一！上交AI科学家王者归来，登顶OpenAI MLE-bench

刚刚，由SciMaster团队推出的AI机器学习专家ML-Master 2.0，基于国产开源大模型DeepSeek，在OpenAI权威基准测试MLE-bench中一举击败Google、Meta、微软等国际顶流，刷新全球SOTA，再次登顶！目前该功能已在SciMaster线上平台开放waiting list，欢迎申请体验。

来自主题: AI技术研报

6525 点击 2025-12-25 14:22