AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
即插即用,快速适配!港大FlashST:简单通用的智慧交通时空预测模型 | ICML 2024

即插即用,快速适配!港大FlashST:简单通用的智慧交通时空预测模型 | ICML 2024

即插即用,快速适配!港大FlashST:简单通用的智慧交通时空预测模型 | ICML 2024

华南理工大学和香港大学的研究人员在ICML 2024上提出了一个简单而通用的时空提示调整框架FlashST,通过轻量级的时空提示网络和分布映射机制,使预训练模型能够适应不同的下游数据集特征,显著提高了模型在多种交通预测场景中的泛化能力。

来自主题: AI技术研报
9032 点击    2024-06-04 15:54
LeCun新作:分层世界模型,数据驱动的人型机器人控制

LeCun新作:分层世界模型,数据驱动的人型机器人控制

LeCun新作:分层世界模型,数据驱动的人型机器人控制

在复杂的物理世界中,人型机器人的全身控制一直是个难题,现有的强化学习做出的效果有时会比较抽象。近日,LeCun参与的一项工作给出了基于数据驱动的全新解决方案。

来自主题: AI技术研报
10029 点击    2024-06-04 15:43
AI预测极端天气提速5000倍!微软发布Aurora,借AI之眼预测全球风暴

AI预测极端天气提速5000倍!微软发布Aurora,借AI之眼预测全球风暴

AI预测极端天气提速5000倍!微软发布Aurora,借AI之眼预测全球风暴

微软发布首个大规模大气基础模型Aurora,可被用于预测和减轻极端天气影响,模型拥有超高的准确率和效率,与如今数值预报系统界的SOTA相比,它的计算速度提高了约5000倍。

来自主题: AI技术研报
10272 点击    2024-06-04 15:29
Mamba-2新架构出世一统江湖!普林斯顿CMU华人再出神作,性能狂飙8倍

Mamba-2新架构出世一统江湖!普林斯顿CMU华人再出神作,性能狂飙8倍

Mamba-2新架构出世一统江湖!普林斯顿CMU华人再出神作,性能狂飙8倍

在开源社区引起「海啸」的Mamba架构,再次卷土重来!这次,Mamba-2顺利拿下ICML。通过统一SSM和注意力机制,Transformer和SSM直接成了「一家亲」,Mamba-2这是要一统江湖了?

来自主题: AI技术研报
7940 点击    2024-06-04 15:20
黄仁勋最新主题演讲:Blackwell 芯片将打破摩尔定律,解决大模型耗电难题

黄仁勋最新主题演讲:Blackwell 芯片将打破摩尔定律,解决大模型耗电难题

黄仁勋最新主题演讲:Blackwell 芯片将打破摩尔定律,解决大模型耗电难题

6 月 2 日,英伟达创始人黄仁勋在 Computex 2024(2024 台北国际电脑展)上发表主题演讲,分享了人工智能时代如何助推全球新产业革命,并且展示了最新的 Blackwell 芯片和后续的一系列更新节奏。

来自主题: AI技术研报
9131 点击    2024-06-04 12:08
土耳其,怎么就在AI应用赛道“遥遥领先”了?

土耳其,怎么就在AI应用赛道“遥遥领先”了?

土耳其,怎么就在AI应用赛道“遥遥领先”了?

在 a16z 给出的按照 MAU 排名的全球 Top50 AI App 榜单中,来自土耳其的 Codeway 和 HubX 两个公司各有三款产品进入了 Top50 当中,除了这 6 款产品,还有 Genie 和 Lisa AI 两款产品也是由土耳其开发者推出的。单论上榜数量,美国开发者排在第一,土耳其敢称第二。

来自主题: AI技术研报
9182 点击    2024-06-04 11:39
深度:生成式AI的存储选型建议

深度:生成式AI的存储选型建议

深度:生成式AI的存储选型建议

合理选择存储,助推生成式AI应用。麦肯锡研究报告显示,到2030年前,生成式AI有望为全球经济贡献7万亿美元的价值。

来自主题: AI技术研报
9100 点击    2024-06-04 11:19
不同数据集有不同的Scaling law?而你可用一个压缩算法来预测它

不同数据集有不同的Scaling law?而你可用一个压缩算法来预测它

不同数据集有不同的Scaling law?而你可用一个压缩算法来预测它

一般而言,训练神经网络耗费的计算量越大,其性能就越好。在扩大计算规模时,必须要做个决定:是增多模型参数量还是提升数据集大小 —— 必须在固定的计算预算下权衡此两项因素。

来自主题: AI技术研报
6624 点击    2024-06-03 17:55
物理传热启发的视觉表征模型vHeat来了,尝试突破注意力机制,兼具低复杂度、全局感受野

物理传热启发的视觉表征模型vHeat来了,尝试突破注意力机制,兼具低复杂度、全局感受野

物理传热启发的视觉表征模型vHeat来了,尝试突破注意力机制,兼具低复杂度、全局感受野

如何突破 Transformer 的 Attention 机制?中国科学院大学与鹏城国家实验室提出基于热传导的视觉表征模型 vHeat。将图片特征块视为热源,并通过预测热传导率、以物理学热传导原理提取图像特征。相比于基于Attention机制的视觉模型, vHeat 同时兼顾了:计算复杂度(1.5次方)、全局感受野、物理可解释性。

来自主题: AI技术研报
8984 点击    2024-06-03 17:51
黄仁勋:英伟达将一年推一款全新芯片,没有英伟达就没有今天AI的一切(附最新演讲全文)

黄仁勋:英伟达将一年推一款全新芯片,没有英伟达就没有今天AI的一切(附最新演讲全文)

黄仁勋:英伟达将一年推一款全新芯片,没有英伟达就没有今天AI的一切(附最新演讲全文)

英伟达是今天生成式AI浪潮里最大的赢家,而黄仁勋要告诉世界,这一切跟运气无关,是英伟达预见并用实力创造了今天的一切。

来自主题: AI技术研报
8861 点击    2024-06-03 15:54
next-token被淘汰!Meta实测「多token」训练方法,推理提速3倍,性能大涨10%+

next-token被淘汰!Meta实测「多token」训练方法,推理提速3倍,性能大涨10%+

next-token被淘汰!Meta实测「多token」训练方法,推理提速3倍,性能大涨10%+

研究人员提出了一种新的大型语言模型训练方法,通过一次性预测多个未来tokens来提高样本效率和模型性能,在代码和自然语言生成任务上均表现出显著优势,且不会增加训练时间,推理速度还能提升至三倍。

来自主题: AI技术研报
8951 点击    2024-06-03 11:00
LLM的「母语」是什么?

LLM的「母语」是什么?

LLM的「母语」是什么?

在以英语为主的语料库上训练的多语言LLM,是否使用英语作为内部语言?对此,来自EPFL的研究人员针对Llama 2家族进行了一系列实验。

来自主题: AI技术研报
9323 点击    2024-06-03 10:53
老黄一口气解密三代GPU!粉碎摩尔定律打造AI帝国,量产Blackwell解决ChatGPT全球耗电难题

老黄一口气解密三代GPU!粉碎摩尔定律打造AI帝国,量产Blackwell解决ChatGPT全球耗电难题

老黄一口气解密三代GPU!粉碎摩尔定律打造AI帝国,量产Blackwell解决ChatGPT全球耗电难题

刚刚,老黄又高调向全世界秀了一把:已经量产的Blackwell,8年内将把1.8万亿参数GPT-4的训练能耗狂砍到1/350;英伟达惊人的产品迭代,直接原地冲破摩尔定律;Blackwell的后三代路线图,也一口气被放出。

来自主题: AI技术研报
8926 点击    2024-06-03 10:48
高效、可泛化的高斯重建框架,只需3张视图即可快速推理,45秒便可完成优化

高效、可泛化的高斯重建框架,只需3张视图即可快速推理,45秒便可完成优化

高效、可泛化的高斯重建框架,只需3张视图即可快速推理,45秒便可完成优化

3D 重建和新视图合成技术在虚拟现实和增强现实等领域有着广泛的应用。NeRF 通过隐式地将场景编码为辐射场,在视图合成上取得了显著的成功。

来自主题: AI技术研报
9077 点击    2024-06-02 14:46
开源模型进展盘点:最新Mixtral、Llama 3、Phi-3、OpenELM到底有多好?

开源模型进展盘点:最新Mixtral、Llama 3、Phi-3、OpenELM到底有多好?

开源模型进展盘点:最新Mixtral、Llama 3、Phi-3、OpenELM到底有多好?

深度学习领域知名研究者、Lightning AI 的首席人工智能教育者 Sebastian Raschka 对 AI 大模型有着深刻的洞察,也会经常把一些观察的结果写成博客。在一篇 5 月中发布的博客中,他盘点分析了 4 月份发布的四个主要新模型:Mixtral、Meta AI 的 Llama 3、微软的 Phi-3 和苹果的 OpenELM。

来自主题: AI技术研报
9445 点击    2024-06-02 14:42
多模态大模型不够灵活,谷歌DeepMind创新架构Zipper:分开训练再「压缩」

多模态大模型不够灵活,谷歌DeepMind创新架构Zipper:分开训练再「压缩」

多模态大模型不够灵活,谷歌DeepMind创新架构Zipper:分开训练再「压缩」

最近的一系列研究表明,纯解码器生成模型可以通过训练利用下一个 token 预测生成有用的表征,从而成功地生成多种模态(如音频、图像或状态 - 动作序列)的新序列,从文本、蛋白质、音频到图像,甚至是状态序列。

来自主题: AI技术研报
8792 点击    2024-06-02 14:38
AlphaFold 3引不满!服务器被黑,全世界科学家竞相破解

AlphaFold 3引不满!服务器被黑,全世界科学家竞相破解

AlphaFold 3引不满!服务器被黑,全世界科学家竞相破解

AlphaFold3的横空出世再次震撼了整个学术界,然而谷歌DeepMind的「不开源」引起学界不满,AlphaFold服务器遭到黑客攻击,开源项目也开始发力。

来自主题: AI技术研报
9316 点击    2024-06-02 14:34
首次解密Claude 3大脑!25岁Anthropic参谋长预言3年内自己将被AI淘汰

首次解密Claude 3大脑!25岁Anthropic参谋长预言3年内自己将被AI淘汰

首次解密Claude 3大脑!25岁Anthropic参谋长预言3年内自己将被AI淘汰

Anthropic的25岁参谋长自曝因为深感AGI,未来三年自己的工作将被AI取代。她在最近的一篇文章中预言了未来即将要被淘汰的工种。难道说,Claude 3模型已经初现AGI了吗?

来自主题: AI技术研报
8751 点击    2024-06-02 14:24
CVPR 2024 | 合成视频数据集里只有单人数据?M3Act破解人群行为标注难题

CVPR 2024 | 合成视频数据集里只有单人数据?M3Act破解人群行为标注难题

CVPR 2024 | 合成视频数据集里只有单人数据?M3Act破解人群行为标注难题

通过视觉信息识别、理解人群的行为是视频监测、交互机器人、自动驾驶等领域的关键技术之一,但获取大规模的人群行为标注数据成为了相关研究的发展瓶颈。如今,合成数据集正成为一种新兴的,用于替代现实世界数据的方法,但已有研究中的合成数据集主要聚焦于人体姿态与形状的估计。它们往往只提供单个人物的合成动画视频,而这并不适用于人群的视频识别任务。

来自主题: AI技术研报
9148 点击    2024-06-01 19:06
超长小说可以用AI翻译了,新型多智能体协作系统媲美人工翻译

超长小说可以用AI翻译了,新型多智能体协作系统媲美人工翻译

超长小说可以用AI翻译了,新型多智能体协作系统媲美人工翻译

机器翻译 (MT) 的最新进展显着提高了各个领域的翻译质量。然而,由于其复杂的语言、比喻表达和文化差异,文学文本的翻译仍然是一个艰巨的挑战。

来自主题: AI技术研报
9095 点击    2024-06-01 19:03