AI资讯新闻榜单内容搜索-AI学术

329篇图像、视频生成论文，今年CVPR最火的研究主题是这些

图像与视频合成、3D 视觉、人体行为识别、视觉与语言推理等研究方向论文最多，属于最热门的方向，体现当前学界对视觉生成、三维感知、人机交互等方向的高度重视。另外，多模态学习、以人为本的设计和自适应机器人可能构成人形机器人的未来。

来自主题: AI资讯

9417 点击 2024-06-08 15:57

物理传热启发的视觉表征模型vHeat来了，尝试突破注意力机制，兼具低复杂度、全局感受野

如何突破 Transformer 的 Attention 机制？中国科学院大学与鹏城国家实验室提出基于热传导的视觉表征模型 vHeat。将图片特征块视为热源，并通过预测热传导率、以物理学热传导原理提取图像特征。相比于基于Attention机制的视觉模型， vHeat 同时兼顾了：计算复杂度（1.5次方）、全局感受野、物理可解释性。

来自主题: AI技术研报

8507 点击 2024-06-03 17:51

AI读论文新神器：多栏密集文字、中英图文混排文档都能读的多模态大模型Fox｜旷视

虽然多模态大模型都能挑西瓜了，但理解复杂文档方面还是差点意思。

来自主题: AI技术研报

8807 点击 2024-06-01 18:49

克雷研究所100万美元奖金要归AI了数学界规则大改，未来数学家如何应对「海量猜想」

数学领域，以其廉价的数据及问题的严谨性，成为了人工智能辅助发现的理想试验场，但唯有人类自己，才能区分出好猜想和坏猜想。

来自主题: AI资讯

10301 点击 2024-05-23 20:18

从Claude 3中提取数百万特征，首次详细理解大模型的「思维」

刚刚，Anthropic 宣布在理解人工智能模型内部运作机制方面取得重大进展。

来自主题: AI资讯

8391 点击 2024-05-22 13:27

Ilya Sutskever精选论文：柏拉图表征假说

AI科学家用深度学习探索现实本质，追求全局最优解。

来自主题: AI资讯

10116 点击 2024-05-20 17:38

哈佛大学朱科航：自动化社会科学Agent与人类行为建模 | Agent Insights

大语言模型可谓是迄今为止对人类行为最大的建模，如何借助大语言模型工具，让科技发展更好地应用到真实人类社会中去？从哈佛物理系到大语言模型结合社会学和经济学的研究，朱科航的思考路径，聚焦在对人类行为的深度学习和理解。在开始今天阅读之前，大家不妨先猜一猜，大语言模型之前人类应用最广的 TOP2 机器学习是什么？Enjoy

来自主题: AI资讯

9676 点击 2024-05-20 15:43

多功能RNA分析，百度团队基于Transformer的RNA语言模型登Nature子刊

预训练语言模型在分析核苷酸序列方面显示出了良好的前景，但使用单个预训练权重集在不同任务中表现出色的多功能模型仍然存在挑战。

来自主题: AI技术研报

9440 点击 2024-05-19 16:29

大模型研究获最佳论文，WWW 2024奖项出炉

本次公布的获奖论文中，有多位华人作者。

来自主题: AI资讯

7096 点击 2024-05-18 17:59

ICML 2024 | 大语言模型预训练新前沿：「最佳适配打包」重塑文档处理标准

在大型语言模型的训练过程中，数据的处理方式至关重要。

来自主题: AI技术研报

9933 点击 2024-05-16 17:41