AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
不依赖token,字节级模型来了!直接处理二进制数据

不依赖token,字节级模型来了!直接处理二进制数据

不依赖token,字节级模型来了!直接处理二进制数据

微软亚研院等发布bGPT,仍旧基于Transformer,但是模型预测的是下一个字节(byte)。

来自主题: AI技术研报
8041 点击    2024-03-11 18:04
华人CV宗师黄煦涛高徒离职特斯拉,加入OpenAI!专攻多模态模型研究

华人CV宗师黄煦涛高徒离职特斯拉,加入OpenAI!专攻多模态模型研究

华人CV宗师黄煦涛高徒离职特斯拉,加入OpenAI!专攻多模态模型研究

华人科学家程博文官宣即将入职OpenAI,加入后训练团队参与多模态模型研究。值得一提的是,他还是著名华人计算机泰斗Thomas Huang的学生。

来自主题: AI技术研报
4900 点击    2024-03-11 17:44
「图结构学习」新思路!港大等提出GraphEdit模型:用LLM删除噪声边,全局理解节点间依赖关系

「图结构学习」新思路!港大等提出GraphEdit模型:用LLM删除噪声边,全局理解节点间依赖关系

「图结构学习」新思路!港大等提出GraphEdit模型:用LLM删除噪声边,全局理解节点间依赖关系

GraphEdit方法可以有效地去除图网络中的噪声连接,还能从全局视角识别节点间的依赖关系,在不同的实验设置中都被验证为有效且稳健。

来自主题: AI技术研报
7101 点击    2024-03-11 17:34
清华NLP组发布InfLLM:无需额外训练,「1024K超长上下文」100%召回!

清华NLP组发布InfLLM:无需额外训练,「1024K超长上下文」100%召回!

清华NLP组发布InfLLM:无需额外训练,「1024K超长上下文」100%召回!

挖掘大模型固有的长文本理解能力,InfLLM在没有引入额外训练的情况下,利用一个外部记忆模块存储超长上下文信息,实现了上下文长度的扩展。

来自主题: AI技术研报
4917 点击    2024-03-11 17:31
DenseMamba:大模型的DenseNet时刻,Mamba和RetNet精度显著提升

DenseMamba:大模型的DenseNet时刻,Mamba和RetNet精度显著提升

DenseMamba:大模型的DenseNet时刻,Mamba和RetNet精度显著提升

近期,来自华为诺亚方舟实验室的研究者提出了 DenseSSM,用于增强 SSM 中各层间隐藏信息的流动。通过将浅层隐藏状态有选择地整合到深层中,DenseSSM 保留了对最终输出至关重要的精细信息。

来自主题: AI技术研报
9538 点击    2024-03-11 17:22
零一万物自研全导航图向量数据库,横扫权威榜单6项第一

零一万物自研全导航图向量数据库,横扫权威榜单6项第一

零一万物自研全导航图向量数据库,横扫权威榜单6项第一

3 月 11 日,零一万物宣布推出基于全导航图的新型向量数据库 「笛卡尔(Descartes)」,已包揽权威榜单 ANN-Benchmarks 6 项数据集评测第一名。

来自主题: AI技术研报
5149 点击    2024-03-11 17:17
用AI短视频「反哺」长视频理解,腾讯MovieLLM框架瞄准电影级连续帧生成

用AI短视频「反哺」长视频理解,腾讯MovieLLM框架瞄准电影级连续帧生成

用AI短视频「反哺」长视频理解,腾讯MovieLLM框架瞄准电影级连续帧生成

在视频理解这一领域,尽管多模态模型在短视频分析上取得了突破性进展,展现出了较强的理解能力,但当它们面对电影级别的长视频时,却显得力不从心。因而,长视频的分析与理解,特别是对于长达数小时电影内容的理解,成为了当前的一个巨大挑战。

来自主题: AI技术研报
9697 点击    2024-03-10 16:19
怎么劝ChatGPT干活效果最好?我们尝试了100种方法,有图有真相

怎么劝ChatGPT干活效果最好?我们尝试了100种方法,有图有真相

怎么劝ChatGPT干活效果最好?我们尝试了100种方法,有图有真相

在 ChatGPT API 中,系统提示是一项很有亮点的功能,它允许开发人员控制 LLM 输出的「角色」,包括特殊规则和限制。系统提示中的命令比用户输入提示中的命令要有效得多,这让开发人员拥有了更大的发挥空间,而不是像现在使用 ChatGPT 网页应用程序和移动应用程序那样仅仅使用用户提示。

来自主题: AI技术研报
5537 点击    2024-03-10 16:13
基于DiT,支持4K图像生成,华为诺亚0.6B文生图模型PixArt-Σ来了

基于DiT,支持4K图像生成,华为诺亚0.6B文生图模型PixArt-Σ来了

基于DiT,支持4K图像生成,华为诺亚0.6B文生图模型PixArt-Σ来了

众所周知,开发顶级的文生图(T2I)模型需要大量资源,因此资源有限的个人研究者基本都不可能承担得起,这也成为了 AIGC(人工智能内容生成)社区创新的一大阻碍。同时随着时间的推移,AIGC 社区又能获得持续更新的、更高质量的数据集和更先进的算法。

来自主题: AI技术研报
9312 点击    2024-03-10 16:10
AI数学基础扫盲

AI数学基础扫盲

AI数学基础扫盲

AI中的应用:在机器学习中,单条数据样本的表征都是以向量化的形式来完成的。向量化的方式可以帮助AI算法在迭代与计算过程中,以更高效的方式完成。

来自主题: AI技术研报
9111 点击    2024-03-10 10:37
Arm 发布 Neoverse 新品:数据分析性能提升 196%,奠定未来计算及 AI 的基石

Arm 发布 Neoverse 新品:数据分析性能提升 196%,奠定未来计算及 AI 的基石

Arm 发布 Neoverse 新品:数据分析性能提升 196%,奠定未来计算及 AI 的基石

北京时间 2 月 22 日,半导体巨头 Arm 更新了 Arm® Neoverse™ 产品路线图,宣布推出两款基于全新第三代 Neoverse IP 构建的全新计算子系统(CSS):Arm Neoverse CSS V3 和 Arm Neoverse CSS N3。

来自主题: AI技术研报
5592 点击    2024-03-09 15:16
大模型在复杂推理任务上潜力如何?多智能体互动框架ThinkThrice玩转剧本杀

大模型在复杂推理任务上潜力如何?多智能体互动框架ThinkThrice玩转剧本杀

大模型在复杂推理任务上潜力如何?多智能体互动框架ThinkThrice玩转剧本杀

剧本杀是一种广受欢迎的多角色扮演侦探游戏,要求玩家扮演不同的角色。通过阅读角色文本、理解各自的故事、搜集线索、以及逻辑推理,玩家们共同努力揭开谜团。游戏角色通常被分为平民和凶手两大类:平民的目标是找出隐藏在他们中间的凶手,而凶手则尽力隐藏自己的身份,避免被发现。那么,如果让 AI 加入游戏,会产生怎样的新变化呢?

来自主题: AI技术研报
6098 点击    2024-03-09 15:12
谷歌具身智能新研究:比RT-2优秀的RT-H来了

谷歌具身智能新研究:比RT-2优秀的RT-H来了

谷歌具身智能新研究:比RT-2优秀的RT-H来了

RT-H 在一系列机器人任务中的表现都优于 RT-2。

来自主题: AI技术研报
7555 点击    2024-03-09 15:09
扩散模型如何构建新一代决策智能体?超越自回归,同时生成长序列规划轨迹

扩散模型如何构建新一代决策智能体?超越自回归,同时生成长序列规划轨迹

扩散模型如何构建新一代决策智能体?超越自回归,同时生成长序列规划轨迹

近期的研究表明,采用扩散模型的规划模块能够同时生成长序列的轨迹规划,这更加符合人类的决策模式。此外,扩散模型在策略表征和数据合成方面也能为现有的决策智能算法提供更优的选择。

来自主题: AI技术研报
6019 点击    2024-03-09 15:05
全球AI人才报告曝光:清华第三,北大第六!硅谷40万人大裁员,码农地狱级面试12场

全球AI人才报告曝光:清华第三,北大第六!硅谷40万人大裁员,码农地狱级面试12场

全球AI人才报告曝光:清华第三,北大第六!硅谷40万人大裁员,码农地狱级面试12场

刚刚发布的AI人才报告显示,全世界的顶尖AI人才中,几乎每两人中就有一人是中国培养出的人才!开卷后,美国码农们也都被迫开启了地狱模式,为一个offer面试12场。

来自主题: AI技术研报
5098 点击    2024-03-08 15:36
揭开Groq LPU神秘面纱:世界最快硬件加速器的底层架构设计!

揭开Groq LPU神秘面纱:世界最快硬件加速器的底层架构设计!

揭开Groq LPU神秘面纱:世界最快硬件加速器的底层架构设计!

Groq一夜爆火的背后,是自研的语言处理单元硬件LPU,近日,Substack的专栏作家Abhinav Upadhyay为我们一步步揭示了LPU底层架构的奥秘

来自主题: AI技术研报
3969 点击    2024-03-08 15:17
挑战OpenAI的新模型免费上线,40%计算量性能逼近GPT-4

挑战OpenAI的新模型免费上线,40%计算量性能逼近GPT-4

挑战OpenAI的新模型免费上线,40%计算量性能逼近GPT-4

本周四,美国 AI 创业公司 Inflection AI 正式发布新一代大语言模型 Inflection-2.5。

来自主题: AI技术研报
4354 点击    2024-03-08 15:11
田渊栋等人新作:突破内存瓶颈,让一块4090预训练7B大模型

田渊栋等人新作:突破内存瓶颈,让一块4090预训练7B大模型

田渊栋等人新作:突破内存瓶颈,让一块4090预训练7B大模型

3 月 6 日,田渊栋又一项研究出炉,这次,他们主攻 LLM 内存效率。除了田渊栋本人,还有来自加州理工学院、德克萨斯大学奥斯汀分校以及 CMU 的研究者。

来自主题: AI技术研报
10563 点击    2024-03-08 15:07
「AI透视眼」,三次马尔奖获得者Andrew带队解决任意物体遮挡补全难题

「AI透视眼」,三次马尔奖获得者Andrew带队解决任意物体遮挡补全难题

「AI透视眼」,三次马尔奖获得者Andrew带队解决任意物体遮挡补全难题

牛津大学 VGG 实验室 Andrew Zisserman 团队最新工作系统性解决了任意物体的遮挡补全问题,并且为这一问题提出了一个新的更加精确的评估数据集。该工作受到了 MPI 大佬 Michael Black、CVPR 官方账号、南加州大学计算机系官方账号等在 X 平台的点赞。

来自主题: AI技术研报
7307 点击    2024-03-08 15:04
谷歌的AI搜索策略,为何如此矛盾?

谷歌的AI搜索策略,为何如此矛盾?

谷歌的AI搜索策略,为何如此矛盾?

3月6日,Alphabet旗下搜索引擎Google宣布更新其搜索排名系统,以便更好地推荐高质量内容,减少那些低质量网页的曝光。对此公司发言人Jennifer Kutz表示,排名变化将“直接解决人工智能生成的低质量内容问题,这些内容旨在吸引点击,但这并没有增加太多原始价值”。

来自主题: AI技术研报
3672 点击    2024-03-08 10:27
中科院等万字详解:最前沿图像扩散模型综述

中科院等万字详解:最前沿图像扩散模型综述

中科院等万字详解:最前沿图像扩散模型综述

针对图像编辑中的扩散模型,中科院联合Adobe和苹果公司的研究人员发布了一篇重磅综述。

来自主题: AI技术研报
4858 点击    2024-03-07 14:24
全面超越ViT,美团、浙大等提出视觉任务统一架构VisionLLAMA

全面超越ViT,美团、浙大等提出视觉任务统一架构VisionLLAMA

全面超越ViT,美团、浙大等提出视觉任务统一架构VisionLLAMA

半年多来,Meta 开源的 LLaMA 架构在 LLM 中经受了考验并大获成功(训练稳定、容易做 scaling)。

来自主题: AI技术研报
4543 点击    2024-03-07 14:01
ICLR 2024 Spotlight | 大语言模型权重、激活的全方位低bit可微量化,已集成进商用APP

ICLR 2024 Spotlight | 大语言模型权重、激活的全方位低bit可微量化,已集成进商用APP

ICLR 2024 Spotlight | 大语言模型权重、激活的全方位低bit可微量化,已集成进商用APP

模型量化是模型压缩与加速中的一项关键技术,其将模型权重与激活值量化至低 bit,以允许模型占用更少的内存开销并加快推理速度。对于具有海量参数的大语言模型而言,模型量化显得更加重要。

来自主题: AI技术研报
8680 点击    2024-03-07 13:53
阿里领投Minimax 6亿美元融资,5家大模型独角兽集齐了

阿里领投Minimax 6亿美元融资,5家大模型独角兽集齐了

阿里领投Minimax 6亿美元融资,5家大模型独角兽集齐了

彭博社消息称,新一轮融资或将使MiniMax估值超25亿美元。目前阿里和红杉已承诺将参与本轮融资,其余跟投者还在洽谈中,相关条款可能会有所调整。

来自主题: AI技术研报
8771 点击    2024-03-07 10:59
你花钱想消除的 AI 水印,其实也是虚假内容的克星

你花钱想消除的 AI 水印,其实也是虚假内容的克星

你花钱想消除的 AI 水印,其实也是虚假内容的克星

我们将介绍 AI 生成内容加水印的方法,讨论其优缺点,并展示 Hugging Face Hub 上一些可用于添加/检测水印的工具。

来自主题: AI技术研报
5455 点击    2024-03-07 10:38