AI技术研报-这里有最前沿的人工智能技术解读

最高220倍加速！面壁小钢炮4.0，稀疏创新黑科技大爆发

有史以来最具想象力的小钢炮系列，MiniCPM 4.0 来了！

来自主题: AI技术研报

9735 点击 2025-06-09 17:50

影视级3D生成新王：Direct3D-S2全面开源！8块GPU超越闭源登顶HF

3D生成模型高光时刻来临！DreamTech联手南大、复旦、牛津发布的Direct3D-S2登顶HuggingFace热榜。仅用8块GPU训练，效果超闭源模型，直指影视级精细度。

来自主题: AI技术研报

10567 点击 2025-06-09 16:52

出海赚美金：用n8n搭建「Reddit商机搜索与洞察」 AI Agent自动化寻找蓝海市场，发现真实痛点

前天，生财有术的老板亦仁发布了一条「超级标」（至少价值千万以上的现象级行业机会）：随着GPT-4o图像革命而来的，是无数的创业机会。

来自主题: AI技术研报

10561 点击 2025-06-09 16:41

3B超越DeepSeek，大模型终于理解时间了！Time-R1一统过去/未来/生成

Time-R1通过三阶段强化学习提升模型的时间推理能力，其核心是动态奖励机制，根据任务难度和训练进程调整奖励，引导模型逐步提升性能，最终使3B小模型实现全面时间推理能力，超越671B模型。

来自主题: AI技术研报

8019 点击 2025-06-09 15:54

给大模型装上「思维分段引擎」：浙大InftyThink解锁无限深度推理

学会“适当暂停与总结”，大模型终于实现无限推理。

来自主题: AI技术研报

10429 点击 2025-06-09 15:20

破解自驾数据难题！毫米波雷达可控仿真技术新框架来了

以神经网络为核心引擎，让AI承担雷达仿真数据生成任务，还实现对雷达物理特性的建模与控制——

来自主题: AI技术研报

9165 点击 2025-06-09 14:58

华为昇腾万卡集群揭秘：如何驯服AI算力「巨兽」？

你是否注意到，现在的 AI 越来越 "聪明" 了？能写小说、做翻译、甚至帮医生看 CT 片，这些能力背后离不开一个默默工作的 "超级大脑工厂"——AI 算力集群。

来自主题: AI技术研报

9650 点击 2025-06-09 14:56

CVPR 2025 Highlight｜AdaCM2：首个面向超长视频理解的跨模态自适应记忆压缩框架

本文第一作者为前阿里巴巴达摩院高级技术专家，现一年级博士研究生满远斌，研究方向为高效多模态大模型推理和生成系统。通信作者为第一作者的导师，UTA 计算机系助理教授尹淼。尹淼博士目前带领 7 人的研究团队，主要研究方向为多模态空间智能系统，致力于通过软件和系统的联合优化设计实现空间人工智能的落地。

来自主题: AI技术研报

10756 点击 2025-06-09 14:51

AI集体“听不懂”！MMAR基准测试揭示音频大模型巨大短板

用AI来整理会议内容，已经是人类的常规操作。不过，你猜怎么着？面对1000道多步骤音频推理题时，30款AI模型竟然几乎全军覆没，很多开源模型表现甚至接近瞎猜。

来自主题: AI技术研报

10617 点击 2025-06-09 14:43

区区一款 AI 会议记录软件凭什么值 2.5 亿美元？| 深度拆解 Granola 的产品哲学

「十字路口」的每一次选题、每一场活动，都像投早期项目 ——我们不只是做内容，而是希望成为「创业者声量放大器 + 早期项目雷达」。

来自主题: AI技术研报

10296 点击 2025-06-09 11:54

硅基流动 SiliconCloud × translate.js：两行代码，让网页秒切 100+ 语言

translate.js（https://github.com/xnx3/translate）是面向开发者打造的一个简单而强大的前端国际化工具，专注于提供极简高效的多语言切换能力。项目完全开源并允许商业使用。

来自主题: AI技术研报

10032 点击 2025-06-09 11:44

LLM已进入「组装」时代，CAIS复合人工智能系统来了

2024年，伯克利人工智能研究中心（BAIR）率先提出了一个新概念——复合人工智能系统（Compound AI Systems，简称CAIS）。这个看似简单的术语背后，蕴含着AI系统架构的根本性改变：不再依赖单一LLM的"超级大脑"，而是构建多组件协同的"智能生态系统"。

来自主题: AI技术研报

9657 点击 2025-06-09 11:32

大模型强化学习新突破——SPO新范式助力大模型推理能力提升！

当前，强化学习（RL）在提升大语言模型（LLM）推理能力方面展现出巨大潜力。DeepSeek R1、Kimi K1.5 和 Qwen 3 等模型充分证明了 RL 在增强 LLM 复杂推理能力方面的有效性。

来自主题: AI技术研报

9197 点击 2025-06-09 11:02

苹果炮轰推理模型全是假思考！4个游戏戳破神话，o3/DeepSeek高难度全崩溃

苹果最新大模型论文，在AI圈炸开了锅。有人总结到：苹果刚刚当了一回马库斯，否定了所有大模型的推理能力。

来自主题: AI技术研报

8669 点击 2025-06-09 10:38

扩展强化学习：环境、奖励黑客、智能体、数据扩展

Test time scaling范式蓬勃发展。推理模型持续快速改进，变得更为高效且价格更为亲民。在评估现实世界软件工程任务（如 SWE-Bench）时，模型以更低的成本取得了更高的分数。以下是显示模型变得更便宜且更优秀的图表。

来自主题: AI技术研报

7785 点击 2025-06-09 10:25

算力终结者来了！华人天团「降维打击」注意力瓶颈，AI狂飙进对数时代

注意力机制的「平方枷锁」，再次被撬开！一招Fenwick树分段，用掩码矩阵，让注意力焕发对数级效率。更厉害的是，它无缝对接线性注意力家族，Mamba-2、DeltaNet 全员提速，跑分全面开花。长序列处理迈入log时代！

来自主题: AI技术研报

10400 点击 2025-06-08 15:27

8个数据集全面胜出！思维链推理刷新图学习表现上限

图神经网络还能更聪明？思维链提示学习来了！

来自主题: AI技术研报

8300 点击 2025-06-08 15:17

告别「失忆」AI！首个大模型记忆操作系统开源框架来了！

该项目来自百家 AI，是北京邮电大学白婷副教授所指导的研究小组，团队致力于为硅基人类倾力打造情感饱满、记忆超凡的智慧大脑。

来自主题: AI技术研报

10205 点击 2025-06-08 15:07

Hinton梦想的AI医生要来了！斯坦福哈佛实测：o1以78%正确率超人类

Hinton梦想的AI医生要来了！斯坦福哈佛实测：o1以78%正确率超人类新智元新智元 2025年06月08日 12:45 北京

来自主题: AI技术研报

9147 点击 2025-06-08 14:58

打破跨模态干扰，快手东北大学联合提出统一多模态框架，横扫多模态检索基准

多模态检索是信息理解与获取的关键技术，但其中的跨模态干扰问题一直是一大难题。

来自主题: AI技术研报

8471 点击 2025-06-08 14:46

为什么用错奖励，模型也能提分？新研究：模型学的不是新知识，是思维

最近的一篇论文中，来自人大和腾讯的研究者们的研究表明，语言模型对强化学习中的奖励噪音具有鲁棒性，即使翻转相当一部分的奖励（例如，正确答案得 0 分，错误答案得 1 分），也不会显著影响下游任务的表现。

来自主题: AI技术研报

8759 点击 2025-06-08 14:35

“不是 Cursor 不够强，是 Claude Code 太猛了” ！创始人详解Claude Code如何改写编程方式

对于许多开发者来说，每月 20 美元的 Cursor 和 Copilot 已经是“无限量”好用的标配。然而，Anthropic 的 Claude Code 却是个异类。

来自主题: AI技术研报

8747 点击 2025-06-08 11:52

没想到，最Open的开源新模型，来自小红书

迄今为止行业最大的开源力度。在大模型上向来低调的小红书，昨天开源了首个自研大模型。

来自主题: AI技术研报

9287 点击 2025-06-07 15:32

你永远叫不醒装睡的大模型！多轮对话全军覆没，性能暴跌39%

20万次模拟实验，耗资5000美元，证实大模型在多轮对话中的表现明显低于单轮对话！一旦模型的第一轮答案出现偏差，不要试图纠正，而是新开一个对话！

来自主题: AI技术研报

7106 点击 2025-06-07 15:01

生图效果媲美GPT-4o，一键搞定各类视觉生成任务丨港科广&字节全新框架

图像生成、视频创作、照片精修需要找不同的模型完成也太太太太太麻烦了。有没有这样一个“AI创作大师”，你只需要用一句话描述脑海中的灵感，它就能自动为你搭建流程、选择工具、反复修改，最终交付高质量的视觉作品呢？

来自主题: AI技术研报

9863 点击 2025-06-07 14:49

多模态模型挑战北京杭州地铁图！o3成绩显著，但跟人类有差距

近年来，大语言模型（LLMs）以及多模态大模型（MLLMs）在多种场景理解和复杂推理任务中取得突破性进展。

来自主题: AI技术研报

9450 点击 2025-06-07 14:20

谷歌Transformer过时了？清华姚班校友等三连击，爆改注意力！

RNN太老，Transformer太慢？谷歌掀翻Transformer王座，用「注意力偏向+保留门」取代传统遗忘机制，重新定义了AI架构设计。全新模型Moneta、Yaad、Memora，在多个任务上全面超越Transformer。这一次，谷歌不是调参，而是换脑！

来自主题: AI技术研报

9895 点击 2025-06-07 14:19

扩散语言模型扛把子LLaDA迎来新版本，数学、代码、对齐能力均提升

本文介绍的工作由中国人民大学高瓴人工智能学院李崇轩、文继荣教授团队与蚂蚁集团共同完成。朱峰琪、王榕甄、聂燊是中国人民大学高瓴人工智能学院的博士生，导师为李崇轩副教授。

来自主题: AI技术研报

12000 点击 2025-06-07 14:05

马斯克祸不单行！擎天柱负责人突然离职，特斯拉蒸发万亿市值

真是屋漏偏逢连夜雨！就在特斯拉创下单日最大跌幅，市值蒸发1500亿美元（折合人民币约10784亿元）之际，马斯克又痛失一位悍将——

来自主题: AI技术研报

8497 点击 2025-06-07 14:04

首个多模态专用慢思考框架！超GPT-o1近7个百分点，强化学习教会VLM「三思而后行」

在文本推理领域，以GPT-o1、DeepSeek-R1为代表的 “慢思考” 模型凭借显式反思机制，在数学和科学任务上展现出远超 “快思考” 模型（如 GPT-4o）的优势。

来自主题: AI技术研报

9220 点击 2025-06-07 11:00