AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
沃顿商学院重磅Prompt报告:别再对AI"循循善诱"了!我们在错误地使用它!

沃顿商学院重磅Prompt报告:别再对AI"循循善诱"了!我们在错误地使用它!

沃顿商学院重磅Prompt报告:别再对AI"循循善诱"了!我们在错误地使用它!

宾夕法尼亚大学沃顿商学院生成式AI实验室刚刚发布了两份重磅研究报告,通过严格的科学实验揭示了一个令人震惊的事实:我们可能一直在用错误的方式与AI对话。这不是胡说八道,而是基于近4万次实验得出的硬核数据推理的结论。

来自主题: AI技术研报
5004 点击    2025-06-10 11:33
60%情况下,主流大模型没理解风险只是装懂!别被模型的“安全答案”骗了

60%情况下,主流大模型没理解风险只是装懂!别被模型的“安全答案”骗了

60%情况下,主流大模型没理解风险只是装懂!别被模型的“安全答案”骗了

让推理模型针对风险指令生成了安全输出,表象下藏着认知危机: 即使生成合规答案,超60%的案例中模型并未真正理解风险。

来自主题: AI技术研报
4889 点击    2025-06-10 11:00
影视级3D生成新王:Direct3D-S2全面开源!8块GPU超越闭源登顶HF

影视级3D生成新王:Direct3D-S2全面开源!8块GPU超越闭源登顶HF

影视级3D生成新王:Direct3D-S2全面开源!8块GPU超越闭源登顶HF

3D生成模型高光时刻来临!DreamTech联手南大、复旦、牛津发布的Direct3D-S2登顶HuggingFace热榜。仅用8块GPU训练,效果超闭源模型,直指影视级精细度。

来自主题: AI技术研报
7525 点击    2025-06-09 16:52
出海赚美金:用n8n搭建「Reddit商机搜索与洞察」 AI Agent自动化寻找蓝海市场,发现真实痛点

出海赚美金:用n8n搭建「Reddit商机搜索与洞察」 AI Agent自动化寻找蓝海市场,发现真实痛点

出海赚美金:用n8n搭建「Reddit商机搜索与洞察」 AI Agent自动化寻找蓝海市场,发现真实痛点

前天,生财有术的老板亦仁发布了一条「超级标」(至少价值千万以上的现象级行业机会): 随着GPT-4o图像革命而来的,是无数的创业机会。

来自主题: AI技术研报
6531 点击    2025-06-09 16:41
3B超越DeepSeek,大模型终于理解时间了!Time-R1一统过去/未来/生成

3B超越DeepSeek,大模型终于理解时间了!Time-R1一统过去/未来/生成

3B超越DeepSeek,大模型终于理解时间了!Time-R1一统过去/未来/生成

Time-R1通过三阶段强化学习提升模型的时间推理能力,其核心是动态奖励机制,根据任务难度和训练进程调整奖励,引导模型逐步提升性能,最终使3B小模型实现全面时间推理能力,超越671B模型。

来自主题: AI技术研报
6063 点击    2025-06-09 15:54
破解自驾数据难题!毫米波雷达可控仿真技术新框架来了

破解自驾数据难题!毫米波雷达可控仿真技术新框架来了

破解自驾数据难题!毫米波雷达可控仿真技术新框架来了

以神经网络为核心引擎,让AI承担雷达仿真数据生成任务,还实现对雷达物理特性的建模与控制——

来自主题: AI技术研报
7163 点击    2025-06-09 14:58
华为昇腾万卡集群揭秘:如何驯服AI算力「巨兽」?

华为昇腾万卡集群揭秘:如何驯服AI算力「巨兽」?

华为昇腾万卡集群揭秘:如何驯服AI算力「巨兽」?

你是否注意到,现在的 AI 越来越 "聪明" 了?能写小说、做翻译、甚至帮医生看 CT 片,这些能力背后离不开一个默默工作的 "超级大脑工厂"——AI 算力集群。

来自主题: AI技术研报
6020 点击    2025-06-09 14:56
CVPR 2025 Highlight|AdaCM2:首个面向超长视频理解的跨模态自适应记忆压缩框架

CVPR 2025 Highlight|AdaCM2:首个面向超长视频理解的跨模态自适应记忆压缩框架

CVPR 2025 Highlight|AdaCM2:首个面向超长视频理解的跨模态自适应记忆压缩框架

本文第一作者为前阿里巴巴达摩院高级技术专家,现一年级博士研究生满远斌,研究方向为高效多模态大模型推理和生成系统。通信作者为第一作者的导师,UTA 计算机系助理教授尹淼。尹淼博士目前带领 7 人的研究团队,主要研究方向为多模态空间智能系统,致力于通过软件和系统的联合优化设计实现空间人工智能的落地。

来自主题: AI技术研报
8070 点击    2025-06-09 14:51
AI集体“听不懂”!MMAR基准测试揭示音频大模型巨大短板

AI集体“听不懂”!MMAR基准测试揭示音频大模型巨大短板

AI集体“听不懂”!MMAR基准测试揭示音频大模型巨大短板

用AI来整理会议内容,已经是人类的常规操作。 不过,你猜怎么着?面对1000道多步骤音频推理题时,30款AI模型竟然几乎全军覆没,很多开源模型表现甚至接近瞎猜。

来自主题: AI技术研报
8056 点击    2025-06-09 14:43
区区一款 AI 会议记录软件凭什么值 2.5 亿美元?| 深度拆解 Granola 的产品哲学

区区一款 AI 会议记录软件凭什么值 2.5 亿美元?| 深度拆解 Granola 的产品哲学

区区一款 AI 会议记录软件凭什么值 2.5 亿美元?| 深度拆解 Granola 的产品哲学

「十字路口」的每一次选题、每一场活动,都像投早期项目 ——我们不只是做内容,而是希望成为「创业者声量放大器 + 早期项目雷达」。

来自主题: AI技术研报
6504 点击    2025-06-09 11:54
硅基流动 SiliconCloud × translate.js:两行代码,让网页秒切 100+ 语言

硅基流动 SiliconCloud × translate.js:两行代码,让网页秒切 100+ 语言

硅基流动 SiliconCloud × translate.js:两行代码,让网页秒切 100+ 语言

translate.js(https://github.com/xnx3/translate)是面向开发者打造的一个简单而强大的前端国际化工具,专注于提供极简高效的多语言切换能力。项目完全开源并允许商业使用。

来自主题: AI技术研报
6084 点击    2025-06-09 11:44
LLM已进入「组装」时代,CAIS复合人工智能系统来了

LLM已进入「组装」时代,CAIS复合人工智能系统来了

LLM已进入「组装」时代,CAIS复合人工智能系统来了

2024年,伯克利人工智能研究中心(BAIR)率先提出了一个新概念——复合人工智能系统(Compound AI Systems,简称CAIS)。这个看似简单的术语背后,蕴含着AI系统架构的根本性改变:不再依赖单一LLM的"超级大脑",而是构建多组件协同的"智能生态系统"。

来自主题: AI技术研报
6758 点击    2025-06-09 11:32
大模型强化学习新突破——SPO新范式助力大模型推理能力提升!

大模型强化学习新突破——SPO新范式助力大模型推理能力提升!

大模型强化学习新突破——SPO新范式助力大模型推理能力提升!

当前,强化学习(RL)在提升大语言模型(LLM)推理能力方面展现出巨大潜力。DeepSeek R1、Kimi K1.5 和 Qwen 3 等模型充分证明了 RL 在增强 LLM 复杂推理能力方面的有效性。

来自主题: AI技术研报
6366 点击    2025-06-09 11:02
扩展强化学习:环境、奖励黑客、智能体、数据扩展

扩展强化学习:环境、奖励黑客、智能体、数据扩展

扩展强化学习:环境、奖励黑客、智能体、数据扩展

Test time scaling范式蓬勃发展。推理模型持续快速改进,变得更为高效且价格更为亲民。在评估现实世界软件工程任务(如 SWE-Bench)时,模型以更低的成本取得了更高的分数。以下是显示模型变得更便宜且更优秀的图表。

来自主题: AI技术研报
5446 点击    2025-06-09 10:25
算力终结者来了!华人天团「降维打击」注意力瓶颈,AI狂飙进对数时代

算力终结者来了!华人天团「降维打击」注意力瓶颈,AI狂飙进对数时代

算力终结者来了!华人天团「降维打击」注意力瓶颈,AI狂飙进对数时代

注意力机制的「平方枷锁」,再次被撬开!一招Fenwick树分段,用掩码矩阵,让注意力焕发对数级效率。更厉害的是,它无缝对接线性注意力家族,Mamba-2、DeltaNet 全员提速,跑分全面开花。长序列处理迈入log时代!

来自主题: AI技术研报
7003 点击    2025-06-08 15:27
告别「失忆」AI!首个大模型记忆操作系统开源框架来了!

告别「失忆」AI!首个大模型记忆操作系统开源框架来了!

告别「失忆」AI!首个大模型记忆操作系统开源框架来了!

该项目来自百家 AI,是北京邮电大学白婷副教授所指导的研究小组, 团队致力于为硅基人类倾力打造情感饱满、记忆超凡的智慧大脑。

来自主题: AI技术研报
7189 点击    2025-06-08 15:07
为什么用错奖励,模型也能提分?新研究:模型学的不是新知识,是思维

为什么用错奖励,模型也能提分?新研究:模型学的不是新知识,是思维

为什么用错奖励,模型也能提分?新研究:模型学的不是新知识,是思维

最近的一篇论文中,来自人大和腾讯的研究者们的研究表明,语言模型对强化学习中的奖励噪音具有鲁棒性,即使翻转相当一部分的奖励(例如,正确答案得 0 分,错误答案得 1 分),也不会显著影响下游任务的表现。

来自主题: AI技术研报
6525 点击    2025-06-08 14:35
没想到,最Open的开源新模型,来自小红书

没想到,最Open的开源新模型,来自小红书

没想到,最Open的开源新模型,来自小红书

迄今为止行业最大的开源力度。在大模型上向来低调的小红书,昨天开源了首个自研大模型。

来自主题: AI技术研报
6747 点击    2025-06-07 15:32
你永远叫不醒装睡的大模型!多轮对话全军覆没,性能暴跌39%

你永远叫不醒装睡的大模型!多轮对话全军覆没,性能暴跌39%

你永远叫不醒装睡的大模型!多轮对话全军覆没,性能暴跌39%

20万次模拟实验,耗资5000美元,证实大模型在多轮对话中的表现明显低于单轮对话!一旦模型的第一轮答案出现偏差,不要试图纠正,而是新开一个对话!

来自主题: AI技术研报
5953 点击    2025-06-07 15:01
生图效果媲美GPT-4o,一键搞定各类视觉生成任务丨港科广&字节全新框架

生图效果媲美GPT-4o,一键搞定各类视觉生成任务丨港科广&字节全新框架

生图效果媲美GPT-4o,一键搞定各类视觉生成任务丨港科广&字节全新框架

图像生成、视频创作、照片精修需要找不同的模型完成也太太太太太麻烦了。 有没有这样一个“AI创作大师”,你只需要用一句话描述脑海中的灵感,它就能自动为你搭建流程、选择工具、反复修改,最终交付高质量的视觉作品呢?

来自主题: AI技术研报
6887 点击    2025-06-07 14:49
多模态模型挑战北京杭州地铁图!o3成绩显著,但跟人类有差距

多模态模型挑战北京杭州地铁图!o3成绩显著,但跟人类有差距

多模态模型挑战北京杭州地铁图!o3成绩显著,但跟人类有差距

近年来,大语言模型(LLMs)以及多模态大模型(MLLMs)在多种场景理解和复杂推理任务中取得突破性进展。

来自主题: AI技术研报
6304 点击    2025-06-07 14:20
谷歌Transformer过时了?清华姚班校友等三连击,爆改注意力!

谷歌Transformer过时了?清华姚班校友等三连击,爆改注意力!

谷歌Transformer过时了?清华姚班校友等三连击,爆改注意力!

RNN太老,Transformer太慢?谷歌掀翻Transformer王座,用「注意力偏向+保留门」取代传统遗忘机制,重新定义了AI架构设计。全新模型Moneta、Yaad、Memora,在多个任务上全面超越Transformer。这一次,谷歌不是调参,而是换脑!

来自主题: AI技术研报
7063 点击    2025-06-07 14:19
扩散语言模型扛把子LLaDA迎来新版本,数学、代码、对齐能力均提升

扩散语言模型扛把子LLaDA迎来新版本,数学、代码、对齐能力均提升

扩散语言模型扛把子LLaDA迎来新版本,数学、代码、对齐能力均提升

本文介绍的工作由中国人民大学高瓴人工智能学院李崇轩、文继荣教授团队与蚂蚁集团共同完成。朱峰琪、王榕甄、聂燊是中国人民大学高瓴人工智能学院的博士生,导师为李崇轩副教授。

来自主题: AI技术研报
9100 点击    2025-06-07 14:05