AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
10步优化超越强化学习,仅需1条未标注数据!后训练强势破局

10步优化超越强化学习,仅需1条未标注数据!后训练强势破局

10步优化超越强化学习,仅需1条未标注数据!后训练强势破局

无监督的熵最小化(EM)方法仅需一条未标注数据和约10步优化,就能显著提升大模型在推理任务上的表现,甚至超越依赖大量数据和复杂奖励机制的强化学习(RL)。EM通过优化模型的预测分布,增强其对正确答案的置信度,为大模型后训练提供了一种更高效简洁的新思路。

来自主题: AI技术研报
6424 点击    2025-06-05 11:43
这一代孩子掉队的新陷阱:AI寒门

这一代孩子掉队的新陷阱:AI寒门

这一代孩子掉队的新陷阱:AI寒门

最近一个很火的话题是“AI寒门”,最初由北京大学教育学院副教授林小英提出,指的是父母由于认知局限,不善用甚至排斥AI,导致孩子错失AI浪潮下优化教育资源的机会。

来自主题: AI技术研报
6709 点击    2025-06-05 11:25
RMoA残差提取Mixture-of-Agents,让Agent发现新东西,并自适应停止「ACL2025」

RMoA残差提取Mixture-of-Agents,让Agent发现新东西,并自适应停止「ACL2025」

RMoA残差提取Mixture-of-Agents,让Agent发现新东西,并自适应停止「ACL2025」

如果你正在开发Agent产品,一定听过或用过Mixture-of-Agents(MoA)架构。这个让多个AI模型协作解决复杂问题的框架,理论上能够集众家之长,实际使用中却让人又爱又恨:

来自主题: AI技术研报
4745 点击    2025-06-05 10:47
GPT-4o连验证码都解不了??SOTA模型成功率仅40%

GPT-4o连验证码都解不了??SOTA模型成功率仅40%

GPT-4o连验证码都解不了??SOTA模型成功率仅40%

当前最强多模态Agent连验证码都解不了?

来自主题: AI技术研报
6849 点击    2025-06-05 10:39
英伟达揭示RL Scaling魔力!训练步数翻倍=推理能力质变,小模型突破推理极限

英伟达揭示RL Scaling魔力!训练步数翻倍=推理能力质变,小模型突破推理极限

英伟达揭示RL Scaling魔力!训练步数翻倍=推理能力质变,小模型突破推理极限

强化学习(RL)到底是语言模型能力进化的「发动机」,还是只是更努力地背题、换个方式答题?这个问题,学界争论已久:RL 真能让模型学会新的推理技能吗,还是只是提高了已有知识的调用效率?

来自主题: AI技术研报
6302 点击    2025-06-05 10:27
昇腾+鲲鹏联手上大招!华为爆改MoE训练,吞吐再飙升20%,内存省70%

昇腾+鲲鹏联手上大招!华为爆改MoE训练,吞吐再飙升20%,内存省70%

昇腾+鲲鹏联手上大招!华为爆改MoE训练,吞吐再飙升20%,内存省70%

最近,华为在MoE训练系统方面,给出了MoE训练算子和内存优化新方案:三大核心算子全面提速,系统吞吐再提20%,Selective R/S实现内存节省70%。

来自主题: AI技术研报
6299 点击    2025-06-04 15:17
Meta新突破!跨模态生成告别噪声:流匹配实现任意模态无缝流转

Meta新突破!跨模态生成告别噪声:流匹配实现任意模态无缝流转

Meta新突破!跨模态生成告别噪声:流匹配实现任意模态无缝流转

在人工智能领域,跨模态生成(如文本到图像、图像到文本)一直是技术发展的前沿方向。现有方法如扩散模型(Diffusion Models)和流匹配(Flow Matching)虽取得了显著进展,但仍面临依赖噪声分布、复杂条件机制等挑战。

来自主题: AI技术研报
6921 点击    2025-06-04 14:18
冲击自回归,扩散模型正在改写下一代通用模型范式

冲击自回归,扩散模型正在改写下一代通用模型范式

冲击自回归,扩散模型正在改写下一代通用模型范式

上个月 21 号,Google I/O 2025 开发者大会可说是吸睛无数,各种 AI 模型、技术、工具、服务、应用让人目不暇接。在这其中,Gemini Diffusion 绝对算是最让人兴奋的进步之一。从名字看得出来,这是一个采用了扩散模型的 AI 模型,而这个模型却并非我们通常看到的扩散式视觉生成模型,而是一个地地道道的语言模型!

来自主题: AI技术研报
6894 点击    2025-06-04 14:04
LeCun新作反杀AGI派!AI连「鸟」都搞不懂,拿什么超越人类?

LeCun新作反杀AGI派!AI连「鸟」都搞不懂,拿什么超越人类?

LeCun新作反杀AGI派!AI连「鸟」都搞不懂,拿什么超越人类?

LLM根本不会思考!LeCun团队新作直接戳破了大模型神话。最新实验揭示了,AI仅在粗糙分类任务表现优秀,却在精细任务中彻底失灵。

来自主题: AI技术研报
6734 点击    2025-06-04 11:06
斯坦福临床医疗AI横评,DeepSeek把谷歌OpenAI都秒了

斯坦福临床医疗AI横评,DeepSeek把谷歌OpenAI都秒了

斯坦福临床医疗AI横评,DeepSeek把谷歌OpenAI都秒了

斯坦福最新大模型医疗任务全面评测,DeepSeek R1以66%胜率拿下第一!

来自主题: AI技术研报
3631 点击    2025-06-04 11:02
让AI像人类一样认知真实世界!UCLA谷歌强强联手,长时记忆+3D空间理解超越基线16.5%

让AI像人类一样认知真实世界!UCLA谷歌强强联手,长时记忆+3D空间理解超越基线16.5%

让AI像人类一样认知真实世界!UCLA谷歌强强联手,长时记忆+3D空间理解超越基线16.5%

想象一下,你在一个陌生的房子里寻找合适的礼物盒包装泰迪熊,需要记住每个房间里的物品特征、位置关系,并根据反馈调整行动。

来自主题: AI技术研报
6685 点击    2025-06-04 10:08
用AI读书、学习,大脑会萎缩吗?

用AI读书、学习,大脑会萎缩吗?

用AI读书、学习,大脑会萎缩吗?

AI工具帮助学生轻松完成作业,但过度依赖导致学习深度不足。研究显示,使用AI辅助的学生练习阶段表现优异,但独立考试时成绩显著下降。认知能力可能因“认知卸载”而退化,年轻群体更易受影响。教育界尝试禁用、引导或改革评估方式,但AI对学习本质的挑战仍未解决。

来自主题: AI技术研报
7854 点击    2025-06-04 09:28
视觉感知驱动的多模态推理,阿里通义提出VRAG,定义下一代检索增强生成

视觉感知驱动的多模态推理,阿里通义提出VRAG,定义下一代检索增强生成

视觉感知驱动的多模态推理,阿里通义提出VRAG,定义下一代检索增强生成

在数字化时代,视觉信息在知识传递和决策支持中的重要性日益凸显。然而,传统的检索增强型生成(RAG)方法在处理视觉丰富信息时面临着诸多挑战。一方面,传统的基于文本的方法无法处理视觉相关数据;另一方面,现有的视觉 RAG 方法受限于定义的固定流程,难以有效激活模型的推理能力。

来自主题: AI技术研报
6984 点击    2025-06-04 09:28
全球AI原生企业,如何演进?

全球AI原生企业,如何演进?

全球AI原生企业,如何演进?

全球AI原生企业围绕OpenAI、Anthropic和谷歌三大生态阵营发展,形成开放多元、安全导向和技术闭环的差异化格局。企业通过多模型接入、自研模型及垂直深耕等策略竞争,生态构建聚焦开发者工具、行业渗透和价格策略,当前行业仍处动态演变阶段,尚未形成最终格局。

来自主题: AI技术研报
7773 点击    2025-06-04 09:13
单卡也能跑万帧!智源发布Video-XL-2,速度、效果、长度全拉满

单卡也能跑万帧!智源发布Video-XL-2,速度、效果、长度全拉满

单卡也能跑万帧!智源发布Video-XL-2,速度、效果、长度全拉满

智源研究院发布开源模型Video-XL-2,显著提升长视频理解能力。该模型在效果、处理长度与速度上全面优化,支持单卡处理万帧视频,编码2048帧仅需12秒。

来自主题: AI技术研报
5972 点击    2025-06-03 17:24
真实评估!北理发布全球首个「全场景教育」基准,支持4000+情境

真实评估!北理发布全球首个「全场景教育」基准,支持4000+情境

真实评估!北理发布全球首个「全场景教育」基准,支持4000+情境

发展教育大模型需要新的数据和评估体系!北京理工大学高扬老师团队推出EduBench,是首个专为教育场景打造的综合评估基准,涵盖9大教育场景、12个多视角评估维度、超4000个教育情境。通过多维度评估指标体系和人工标注一致性计算,确保评估可靠性,助力教育大模型发展,推动教育智能化。

来自主题: AI技术研报
8037 点击    2025-06-03 16:47
Trae国际版详细付费教程(内附避坑指南)

Trae国际版详细付费教程(内附避坑指南)

Trae国际版详细付费教程(内附避坑指南)

Trae国际版昨天上新了付费模式,本来没想着写付费教程,毕竟付费嘛,给钱就完了,但是我发现还真不是那么简单,我自己付费过程中也遇到了一些问题,同时呢,在官方群看到有好多小伙伴本来是想月付的,结果直接变成年付了,也就是直接付了90美刀,还没有退款渠道,只能给Trae官方发邮件,所以我还是写一个吧,给想付费的小伙伴提个醒也是好的。

来自主题: AI技术研报
8203 点击    2025-06-03 15:50
ACL2025 | 传统符号语言传递知识太低效?探索LLM高效参数迁移可行性

ACL2025 | 传统符号语言传递知识太低效?探索LLM高效参数迁移可行性

ACL2025 | 传统符号语言传递知识太低效?探索LLM高效参数迁移可行性

人类的思维是非透明的,没有继承的记忆,因此需要通过语言交流的环境来学习。人类的知识传递长期依赖符号语言:从文字、数学公式到编程代码,我们通过符号系统将知识编码、解码。但这种方式存在天然瓶颈,比如信息冗余、效率低下等。

来自主题: AI技术研报
7988 点击    2025-06-03 14:57
万帧?单卡!智源研究院开源轻量级超长视频理解模型Video-XL-2

万帧?单卡!智源研究院开源轻量级超长视频理解模型Video-XL-2

万帧?单卡!智源研究院开源轻量级超长视频理解模型Video-XL-2

长视频理解是多模态大模型关键能力之一。尽管 OpenAI GPT-4o、Google Gemini 等私有模型已在该领域取得显著进展,当前的开源模型在效果、计算开销和运行效率等方面仍存在明显短板。

来自主题: AI技术研报
5892 点击    2025-06-03 14:44
从DeepSeek崛起到下一个亿级销量市场,这份硬核报告说明白了(附原版63页PDF)

从DeepSeek崛起到下一个亿级销量市场,这份硬核报告说明白了(附原版63页PDF)

从DeepSeek崛起到下一个亿级销量市场,这份硬核报告说明白了(附原版63页PDF)

2025第一季度刚刚过完,中国大模型“国产之光”已经可以预定一个年度关键词了。从DeepSeek走红全网,到Manus一夜爆火,再到宇树为代表的机器人让中外网友连连惊呼……毫无疑问,中国前沿科技,正在2025年成为全世界热议和肯定的焦点。

来自主题: AI技术研报
7879 点击    2025-06-03 14:24
函数调用提示词咋写,看下OpenAI发布的Function Calling指南(万字含示例)|最新

函数调用提示词咋写,看下OpenAI发布的Function Calling指南(万字含示例)|最新

函数调用提示词咋写,看下OpenAI发布的Function Calling指南(万字含示例)|最新

端午节前OpenAI发布了o3/o4-mini模型的Function Calling指南,这份指南可以说是目前网上最硬核权威的大模型函数调用实战手册,没有之一。

来自主题: AI技术研报
7082 点击    2025-06-03 12:19