AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
陶哲轩“喂饭级”AI教程来了!只用GitHub Copilot证明函数极限问题

陶哲轩“喂饭级”AI教程来了!只用GitHub Copilot证明函数极限问题

陶哲轩“喂饭级”AI教程来了!只用GitHub Copilot证明函数极限问题

视频新人博主陶哲轩又更新了!这次是“喂饭级”AI教程—— 手把手演示如何只用GitHub Copilot证明函数极限问题。

来自主题: AI技术研报
7911 点击    2025-05-21 10:47
Nature子刊:人类又输给了AI,尤其是当它知道你是谁时

Nature子刊:人类又输给了AI,尤其是当它知道你是谁时

Nature子刊:人类又输给了AI,尤其是当它知道你是谁时

洛桑联邦理工学院研究团队发现,当GPT-4基于对手个性化信息调整论点时,64%的情况下说服力超过人类。实验通过900人参与辩论对比人机表现,结果显示个性化AI达成一致概率提升81.2%。研究警示LLM可能被用于传播虚假信息,建议利用AI生成反叙事内容应对威胁,但实验环境与真实场景存在差异。

来自主题: AI技术研报
6422 点击    2025-05-21 09:52
这宣传图也太上流了!藏师傅教大家如何用4o搭配提示词生成

这宣传图也太上流了!藏师傅教大家如何用4o搭配提示词生成

这宣传图也太上流了!藏师傅教大家如何用4o搭配提示词生成

今天橘子的新产品可以一分钟将任何内容变成播客的 ListenHub发布了,照例想用提示词为他做一张长图。

来自主题: AI技术研报
8214 点击    2025-05-20 16:58
基本物理任务,全球顶级AI均失败!普通零件加工,o3不如老师傅

基本物理任务,全球顶级AI均失败!普通零件加工,o3不如老师傅

基本物理任务,全球顶级AI均失败!普通零件加工,o3不如老师傅

在基本物理任务上,前沿AI模型仍会失败!ML研究院的测试案例显示白领将被Ai替代,而制造业等蓝领工作不受影响。未来已来,只是分布得不均匀。

来自主题: AI技术研报
6957 点击    2025-05-20 15:24
华为:让DeepSeek的“专家们”动起来,推理延迟降10%!

华为:让DeepSeek的“专家们”动起来,推理延迟降10%!

华为:让DeepSeek的“专家们”动起来,推理延迟降10%!

要问最近哪个模型最火,混合专家模型(MoE,Mixture of Experts)绝对是榜上提名的那一个。

来自主题: AI技术研报
8057 点击    2025-05-20 15:16
ICRA 2025|通用多机器人长时任务规划框架破解任务分配难题,成功率+105%、效率+36%

ICRA 2025|通用多机器人长时任务规划框架破解任务分配难题,成功率+105%、效率+36%

ICRA 2025|通用多机器人长时任务规划框架破解任务分配难题,成功率+105%、效率+36%

2025 年 5 月,美国加州大学河滨分校 (UC Riverside) 与宾夕法尼亚州立大学 (Penn State University) 联合团队在机器人领域顶级会议 ICRA 2025 上发布最新研究成果 LaMMA-P。

来自主题: AI技术研报
8964 点击    2025-05-20 14:50
多模态检索大升级!智源三大SOTA模型,代码、图文理解能力拉满

多模态检索大升级!智源三大SOTA模型,代码、图文理解能力拉满

多模态检索大升级!智源三大SOTA模型,代码、图文理解能力拉满

就在刚刚,智源研究员联合多所高校开放三款向量模型,以大优势登顶多项测试基准。其中,BGE-Code-v1直接击穿代码检索天花板,百万行级代码库再也不用怕了!

来自主题: AI技术研报
4801 点击    2025-05-20 14:45
震撼全网,AlphaEvolve矩阵乘法突破被证明为真!开发者用代码证实

震撼全网,AlphaEvolve矩阵乘法突破被证明为真!开发者用代码证实

震撼全网,AlphaEvolve矩阵乘法突破被证明为真!开发者用代码证实

太震撼了,有开发者代码实证后发现,谷歌AlphaEvolve的矩阵乘法突破,被证明为真!Claude辅助下,他成功证明,它果然仅用了48次乘法,就正确完成了4×4矩阵的乘法运算。接下来,可以坐等AlphaEvolve更「奇点」的发现了。

来自主题: AI技术研报
9285 点击    2025-05-20 10:58
可靠的Agent该用哪个模型,LLM多轮对话中的「迷失」现象 |微软最新

可靠的Agent该用哪个模型,LLM多轮对话中的「迷失」现象 |微软最新

可靠的Agent该用哪个模型,LLM多轮对话中的「迷失」现象 |微软最新

微软最近与Salesforce Research联合发布了一篇名为《Lost in Conversation》的研究,说当前最先进的LLM在多轮对话中表现会大幅下降,平均降幅高达39%。这一现象被称为对话中的"迷失"。文章分析了各大模型(包括Claude 3.7-Sonnet、Deepseek-R1等)在多轮对话中的表现差异,还解析了模型"迷失"的根本原因及有效缓解策略。

来自主题: AI技术研报
7021 点击    2025-05-20 10:16
颜水成领衔,给AI分段位!超100款多模态模型,无人达到L5

颜水成领衔,给AI分段位!超100款多模态模型,无人达到L5

颜水成领衔,给AI分段位!超100款多模态模型,无人达到L5

理想中的多模态大模型应该是什么样?十所顶尖高校联合发布General-Level评估框架和General-Bench基准数据集,用五级分类制明确了多模态通才模型的能力标准。当前多模态大语言模型在任务支持、模态覆盖等方面存在不足,且多数通用模型未能超越专家模型,真正的通用人工智能需要实现模态间的协同效应。

来自主题: AI技术研报
8042 点击    2025-05-19 17:08
Index-AniSora:B站开源动画生成模型,斩获多项SOTA入选IJCAI25

Index-AniSora:B站开源动画生成模型,斩获多项SOTA入选IJCAI25

Index-AniSora:B站开源动画生成模型,斩获多项SOTA入选IJCAI25

B 站开源动画视频生成模型 Index-AniSora,支持番剧、国创、漫改动画、VTuber、动画 PV、鬼畜动画等多种二次元风格视频镜头一键生成!

来自主题: AI技术研报
7059 点击    2025-05-19 16:46
华为+DeepSeek,推理性能创新高!技术报告也公布出来了

华为+DeepSeek,推理性能创新高!技术报告也公布出来了

华为+DeepSeek,推理性能创新高!技术报告也公布出来了

部署超大规模MoE这件事,国产芯片的推理性能,已经再创新高了—— 不仅是“英伟达含量为0”这么简单,更是性能全面超越英伟达Hopper架构!

来自主题: AI技术研报
9009 点击    2025-05-19 16:37
LLM又曝致命缺陷:根本不会看时钟!博士惊呆,准确率不及50%

LLM又曝致命缺陷:根本不会看时钟!博士惊呆,准确率不及50%

LLM又曝致命缺陷:根本不会看时钟!博士惊呆,准确率不及50%

AI能写论文、画图、考高分,但连「看表读时间」「今天是星期几」都错得离谱?最新研究揭示了背后惊人的认知缺陷,提醒我们:AI很强大,但精确推理还离不开人类。

来自主题: AI技术研报
7025 点击    2025-05-19 16:06
AI生成视频总不符合物理规律?匹兹堡大学团队新作PhyT2V:不重训练模型也能让物理真实度狂飙2.3倍!

AI生成视频总不符合物理规律?匹兹堡大学团队新作PhyT2V:不重训练模型也能让物理真实度狂飙2.3倍!

AI生成视频总不符合物理规律?匹兹堡大学团队新作PhyT2V:不重训练模型也能让物理真实度狂飙2.3倍!

本文由匹兹堡大学智能系统实验室(Intelligent Systems Laboratory)的研究团队完成。第一作者为匹兹堡大学的一年级博士生薛琪耀。

来自主题: AI技术研报
7711 点击    2025-05-19 14:12
1篇长文 = N张小红书爆款图?!Gemini 2.5 Pro 这效率,我跪了!

1篇长文 = N张小红书爆款图?!Gemini 2.5 Pro 这效率,我跪了!

1篇长文 = N张小红书爆款图?!Gemini 2.5 Pro 这效率,我跪了!

你有没有这样的烦恼:辛辛苦苦写完一篇公众号文章,想转发到小红书,却要再花大量时间制作3:4比例的精美图片?作为一个小红书小号拥有者(小1万粉丝呢,虽然躺在那吃灰有点可惜),我深知这种痛苦。每次想着要做几张图片就头大,甚至因此放弃了不少内容的二次分发。

来自主题: AI技术研报
8171 点击    2025-05-19 11:06
换模型就得重新优化提示词?用下MetaSPO,专门优化系统提示的Meta-Learning框架 | 最新

换模型就得重新优化提示词?用下MetaSPO,专门优化系统提示的Meta-Learning框架 | 最新

换模型就得重新优化提示词?用下MetaSPO,专门优化系统提示的Meta-Learning框架 | 最新

每次更换语言模型就要重新优化提示词?资源浪费且效率低下!本文介绍MetaSPO框架,首个专注模型迁移系统提示优化的元学习方法,让一次优化的提示可跨模型通用。我在儿童教育场景的实验验证了效果:框架自动生成了五种不同教育范式的系统提示,最优的"苏格拉底式"提示成功由DeepSeek-V3迁移到通义千问模型,评分从0.3920提升至0.4362。

来自主题: AI技术研报
5861 点击    2025-05-19 10:11
CVPR 2025 | SketchVideo让手绘动起来,视频生成进入线稿时代

CVPR 2025 | SketchVideo让手绘动起来,视频生成进入线稿时代

CVPR 2025 | SketchVideo让手绘动起来,视频生成进入线稿时代

近年来,生成式人工智能的快速发展,在文本和图像生成领域都取得了很大的成功。

来自主题: AI技术研报
5921 点击    2025-05-18 16:01
ICML 2025 Spotlight | 用傅里叶分解探讨图像对抗扰动,代码已开源

ICML 2025 Spotlight | 用傅里叶分解探讨图像对抗扰动,代码已开源

ICML 2025 Spotlight | 用傅里叶分解探讨图像对抗扰动,代码已开源

本文作者分别来自中国科学院大学和中国科学院计算技术研究所。第一作者裴高政为中国科学院大学博士二年级学生,本工作共同通讯作者是中国科学院大学马坷副教授和黄庆明教授。

来自主题: AI技术研报
8190 点击    2025-05-18 14:47
ICML 2025|如何凭「自动补全」实现100K生成3×加速?

ICML 2025|如何凭「自动补全」实现100K生成3×加速?

ICML 2025|如何凭「自动补全」实现100K生成3×加速?

在当前大模型推理愈发复杂的时代,如何快速、高效地产生超长文本,成为了模型部署与优化中的一大核心挑战。

来自主题: AI技术研报
7317 点击    2025-05-18 14:38
图像分词器造反了!华为 Selftok:自回归内核完美统一扩散模型,触发像素自主推理

图像分词器造反了!华为 Selftok:自回归内核完美统一扩散模型,触发像素自主推理

图像分词器造反了!华为 Selftok:自回归内核完美统一扩散模型,触发像素自主推理

自回归(AR)范式凭借将语言转化为离散 token 的核心技术,在大语言模型领域大获成功 —— 从 GPT-3 到 GPT-4o,「next-token prediction」以简单粗暴的因果建模横扫语言领域。

来自主题: AI技术研报
7153 点击    2025-05-18 14:28
中国科学院计算所:从 NFS 到 JuiceFS,大模型训推平台存储演进之路

中国科学院计算所:从 NFS 到 JuiceFS,大模型训推平台存储演进之路

中国科学院计算所:从 NFS 到 JuiceFS,大模型训推平台存储演进之路

经过对多种开源存储系统的评估对比,我们选择了 JuiceFS 。我们的架构采用 Redis 进行高性能元数据管理,同时构建了自有 MinIO 集群作为底层对象存储,这一架构完美解决了模型训练场景中的数据读写瓶颈、元数据访问延迟以及计算资源之间的存储互通问题。

来自主题: AI技术研报
6660 点击    2025-05-18 10:29
AI怎样模仿人类大脑的注意力机制?

AI怎样模仿人类大脑的注意力机制?

AI怎样模仿人类大脑的注意力机制?

最近,人们对AI谈得最多的是deepseek(简称DS)。这匹来自中国本土的黑马,闯入全球视野,一度扰乱美国股市,在 AI 领域掀起了一场轩然大波。

来自主题: AI技术研报
7930 点击    2025-05-17 18:15