AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
专治不服!Amazon重磅发布!AI的SOP高考来了!顶级Agent能考几分?

专治不服!Amazon重磅发布!AI的SOP高考来了!顶级Agent能考几分?

专治不服!Amazon重磅发布!AI的SOP高考来了!顶级Agent能考几分?

您可能会问,LLM Agent的SOP到底是什么,为什么称它为AI的高考?SOP全称是标准操作程序(Standard Operating Procedures)很多朋友可能很熟悉,但它绝不是简单的步骤清单——它更像是AI能否在工业环境中真正"上岗"的终极考验。

来自主题: AI技术研报
6564 点击    2025-06-13 11:35
四万字·深度求索|泛聊一下强化学习(RL)下的深度推理(DR)对真实世界(RW)建模与泛化的本质

四万字·深度求索|泛聊一下强化学习(RL)下的深度推理(DR)对真实世界(RW)建模与泛化的本质

四万字·深度求索|泛聊一下强化学习(RL)下的深度推理(DR)对真实世界(RW)建模与泛化的本质

强化学习·RL范式尝试为LLMs应用于广泛的Agentic AI甚至构建AGI打开了一扇“深度推理”的大门,而RL是否是唯一且work的一扇门,先按下不表(不作为今天跟大家唠的重点),至少目前看来,随着o1/o3/r1/qwq..等一众语言推理模型的快速发展,正推动着LLMs和Agentic AI在不同领域的价值与作用,

来自主题: AI技术研报
7949 点击    2025-06-13 10:48
当谣言搭上“AI”的东风

当谣言搭上“AI”的东风

当谣言搭上“AI”的东风

标识能否有效应对?

来自主题: AI技术研报
6285 点击    2025-06-13 10:42
AI自动写学术综述:10分钟生成6万字,成本不到四块钱

AI自动写学术综述:10分钟生成6万字,成本不到四块钱

AI自动写学术综述:10分钟生成6万字,成本不到四块钱

学术综述论文在科学研究中发挥着至关重要的作用,特别是在研究文献快速增长的时代。传统的人工驱动综述写作需要研究者审阅大量文章,既耗时又难以跟上最新进展。而现有的自动化综述生成方法面临诸多挑战:

来自主题: AI技术研报
5406 点击    2025-06-13 10:35
DeepMind首个猜想库开源,获陶哲轩力挺!

DeepMind首个猜想库开源,获陶哲轩力挺!

DeepMind首个猜想库开源,获陶哲轩力挺!

谷歌DeepMind重磅出击,开源首个形式化数学猜想库,获陶哲轩力挺!从解析数论的兰道猜想开始,这个开源项目将为AI破解数学难题的未来铺路。

来自主题: AI技术研报
5603 点击    2025-06-12 18:03
256块NPU训成8B视频模型、超越Sora等一众闭源!抖音内容技术团队开源ContentV

256块NPU训成8B视频模型、超越Sora等一众闭源!抖音内容技术团队开源ContentV

256块NPU训成8B视频模型、超越Sora等一众闭源!抖音内容技术团队开源ContentV

近日,抖音内容技术团队开源了 ContentV,一种面向视频生成任务的高效训练方案。该方案在多项技术优化的基础上,使用 256 块 NPU,在约 4 周内完成了一个 8B 参数模型的训练。尽管资源有限,ContentV 在多个评估维度上取得了与现有主流方案相近的生成效果。

来自主题: AI技术研报
7954 点击    2025-06-12 17:56
从 Cursor 到 Claude Code,我发现了 AI 编程的真正价值

从 Cursor 到 Claude Code,我发现了 AI 编程的真正价值

从 Cursor 到 Claude Code,我发现了 AI 编程的真正价值

张小龙说,设计就是分类,我认为写作也是一种分类,有助于定义问题和讨论问题,所以在探讨 AI 编码之前,需要分清出什么时候是在氛围编码(Vibe coding),什么时候是在用 AI 辅助编程。

来自主题: AI技术研报
4531 点击    2025-06-12 17:51
银河通用X清华大学发布业内首款开源人形机器人全身遥操系统OpenWBT,支持多机型、跨虚实,小时内可轻松部署

银河通用X清华大学发布业内首款开源人形机器人全身遥操系统OpenWBT,支持多机型、跨虚实,小时内可轻松部署

银河通用X清华大学发布业内首款开源人形机器人全身遥操系统OpenWBT,支持多机型、跨虚实,小时内可轻松部署

大数据和大模型已成为具身智能领域业界和学术界的焦点,人们也在期待人形机器人真正步入大数据、大模型时代。然而,行业一直缺乏稳定的人形机器人全身遥操作与数据采集方案。

来自主题: AI技术研报
6169 点击    2025-06-12 17:43
2D图像作中介,零训练实现3D场景生成SOTA:英伟达&康奈尔提出文本驱动新流程

2D图像作中介,零训练实现3D场景生成SOTA:英伟达&康奈尔提出文本驱动新流程

2D图像作中介,零训练实现3D场景生成SOTA:英伟达&康奈尔提出文本驱动新流程

想象一下,你是一位游戏设计师,正在为一个奇幻 RPG 游戏搭建场景。你需要创建一个 "精灵族树屋村落"—— 参天古木和树屋、发光的蘑菇路灯、半透明的纱幔帐篷... 传统工作流程中,这可能需要数周时间:先手工建模每个 3D 资产,再逐个调整位置和材质,最后反复测试光照效果…… 总之就是一个字,难。

来自主题: AI技术研报
7381 点击    2025-06-12 17:09
AI真有希望考清北了!豆包1.6多模态推理发威,闯关数理化带图大题

AI真有希望考清北了!豆包1.6多模态推理发威,闯关数理化带图大题

AI真有希望考清北了!豆包1.6多模态推理发威,闯关数理化带图大题

豆包大模型1.6惊艳亮相,成为国内首款多模态SOTA模型,256k对话窗口,深度思考最长上下文。它不仅能看会想,还能动手操作GUI,国内最有潜力考清北。

来自主题: AI技术研报
6154 点击    2025-06-12 17:04
通义实验室最新成果WebDancer:开启自主智能Deep Research的新时代

通义实验室最新成果WebDancer:开启自主智能Deep Research的新时代

通义实验室最新成果WebDancer:开启自主智能Deep Research的新时代

作者介绍: 本文作者来自通义实验室 RAG 团队,致力于面向下一代 RAG 技术进行基础研究。该团队 WebWalker 工作近期也被 ACL 2025 main conference 录用。

来自主题: AI技术研报
6155 点击    2025-06-12 15:24
12个高效让Cursor改bug的技巧,彻底解放AI编程生产力

12个高效让Cursor改bug的技巧,彻底解放AI编程生产力

12个高效让Cursor改bug的技巧,彻底解放AI编程生产力

今天聊个让所有AI Coder都“红温”的话题:用Cursor改Bug,怎么就那么容易翻车?需求描述得清清楚楚,它却越改越乱,好不容易修好一个,又带出仨新的,简直心态爆炸!😭

来自主题: AI技术研报
6340 点击    2025-06-12 15:14
别再信“LRM无需优化提示词”了,你至少输掉23%的性能,以R1为例

别再信“LRM无需优化提示词”了,你至少输掉23%的性能,以R1为例

别再信“LRM无需优化提示词”了,你至少输掉23%的性能,以R1为例

还记得DeepSeek-R1发布时AI圈的那波狂欢吗?"提示工程已死"、"再也不用费心写复杂提示了"、"推理模型已经聪明到不再需要学习提示词了"......这些观点在社交媒体上刷屏,连不少技术大佬都在转发。再到最近,“提示词写死了”......现实总是来得这么快——乔治梅森大学的研究者们用一个严谨得让人无法反驳的实验,狠狠打了所有人的脸!

来自主题: AI技术研报
7089 点击    2025-06-12 11:59
CVPR 2025 | 多模态统一学习新范式来了,数据、模型、代码全部开源

CVPR 2025 | 多模态统一学习新范式来了,数据、模型、代码全部开源

CVPR 2025 | 多模态统一学习新范式来了,数据、模型、代码全部开源

我们人类生活在一个充满视觉和音频信息的世界中,近年来已经有很多工作利用这两个模态的信息来增强模型对视听场景的理解能力,衍生出了多种不同类型的任务,它们分别要求模型具备不同层面的能力。

来自主题: AI技术研报
7639 点击    2025-06-12 11:43
AI 重塑教育:2025 四维图鉴

AI 重塑教育:2025 四维图鉴

AI 重塑教育:2025 四维图鉴

多鲸即将发布《2025 AI 赋能教育行业发展趋势报告》,该文为预览先导精彩内容。本文将从 AI 如何驱动教育「需求演进」、AI 在「场景创新」中的具体应用,以及由此形成的「生态融合与市场爆发」这四个维度,深入探讨 AI+教育的未来图景。

来自主题: AI技术研报
7082 点击    2025-06-12 10:56
最大的开源GraphRag:知识图谱完全自主构建|港科大&华为

最大的开源GraphRag:知识图谱完全自主构建|港科大&华为

最大的开源GraphRag:知识图谱完全自主构建|港科大&华为

知识图谱(KGs)已经可以很好地将海量的复杂信息整理成结构化的、机器可读的知识,但目前的构建方法仍需要由领域专家预先创建模式,这限制了KGs的可扩展性、适应性和领域覆盖范围。

来自主题: AI技术研报
8154 点击    2025-06-12 10:50
Mistral的首个强推理模型:拥抱开源,推理速度快10倍

Mistral的首个强推理模型:拥抱开源,推理速度快10倍

Mistral的首个强推理模型:拥抱开源,推理速度快10倍

强推理终于要卷速度了。 大模型强推理赛道,又迎来一位重量级玩家。

来自主题: AI技术研报
6382 点击    2025-06-11 16:46
布局有志丨AI头部公司的生态之相丨Xsignal

布局有志丨AI头部公司的生态之相丨Xsignal

布局有志丨AI头部公司的生态之相丨Xsignal

当OpenAI以65亿美元估值收购前苹果传奇设计师乔纳森·伊夫(Jony Ive)的AI硬件初创公司io时,AI行业对大模型公司的生态战略产生了热议。

来自主题: AI技术研报
6020 点击    2025-06-11 16:32
“甲方快乐模型”诞生,拿下平面设计新SOTA!多条件一键生成,还能独立调整元素 | 复旦&字节

“甲方快乐模型”诞生,拿下平面设计新SOTA!多条件一键生成,还能独立调整元素 | 复旦&字节

“甲方快乐模型”诞生,拿下平面设计新SOTA!多条件一键生成,还能独立调整元素 | 复旦&字节

平面设计师有救了! 复旦大学和字节跳动团队联合提出CreatiDesign新模型,可实现高精度、多模态、可编辑的AI图形设计生成。

来自主题: AI技术研报
6148 点击    2025-06-11 16:18
「Next-Token」范式改变!刚刚,强化学习预训练来了

「Next-Token」范式改变!刚刚,强化学习预训练来了

「Next-Token」范式改变!刚刚,强化学习预训练来了

谁说强化学习只能是蛋糕上的樱桃,说不定,它也可以是整个蛋糕呢?

来自主题: AI技术研报
5178 点击    2025-06-11 14:58
103K「硬核」题,让大模型突破数学推理瓶颈

103K「硬核」题,让大模型突破数学推理瓶颈

103K「硬核」题,让大模型突破数学推理瓶颈

本文将介绍 DeepMath-103K 数据集。该工作由腾讯 AI Lab 与上海交通大学团队共同完成。

来自主题: AI技术研报
8162 点击    2025-06-11 14:50
10%训练数据超越100%表现,机器人学习领域迎来重要突破

10%训练数据超越100%表现,机器人学习领域迎来重要突破

10%训练数据超越100%表现,机器人学习领域迎来重要突破

第一作者陈昌和是美国密歇根大学的研究生,师从 Nima Fazeli 教授,研究方向包括基础模型、机器人学习与具身人工智能,专注于机器人操控、物理交互与控制优化。

来自主题: AI技术研报
9223 点击    2025-06-11 14:29
揭秘LLM“思考”之谜:推理即“梯度下降”,元学习框架解构训练过程,还给优化提供新思路

揭秘LLM“思考”之谜:推理即“梯度下降”,元学习框架解构训练过程,还给优化提供新思路

揭秘LLM“思考”之谜:推理即“梯度下降”,元学习框架解构训练过程,还给优化提供新思路

近年来,大语言模型(LLM)以其卓越的文本生成和逻辑推理能力,深刻改变了我们与技术的互动方式。然而,这些令人瞩目的表现背后,LLM的内部机制却像一个神秘的“黑箱”,让人难以捉摸其决策过程。

来自主题: AI技术研报
5415 点击    2025-06-11 14:29