AI技术研报-这里有最前沿的人工智能技术解读

神经网络可能不再需要激活函数？Layer Normalization也具有非线性表达！

神经网络通常由三部分组成：线性层、非线性层（激活函数）和标准化层。线性层是网络参数的主要存在位置，非线性层提升神经网络的表达能力，而标准化层（Normalization）主要用于稳定和加速神经网络训练，很少有工作研究它们的表达能力，例如，以Batch Normalization为例

来自主题: AI技术研报

6916 点击 2024-07-02 17:38

哈工大提出创新迭代推理框架 DPE-MNER ：充分发挥多模态表示潜力

多模态命名实体识别，作为构建多模态知识图谱的一项基础而关键任务，要求研究者整合多种模态信息以精准地从文本中提取命名实体。尽管以往的研究已经在不同层次上探索了多模态表示的整合方法，但在将这些多模态表示融合以提供丰富上下文信息、进而提升多模态命名实体识别的性能方面，它们仍显不足。

来自主题: AI技术研报

5715 点击 2024-07-02 17:35

ML工程师一次微调7个模型，击败OpenAI GPT-4

「微调你的模型，获得比GPT-4更好的性能」不只是说说而已，而是真的可操作。最近，一位愿意动手的ML工程师就把几个开源LLM调教成了自己想要的样子。

来自主题: AI技术研报

9335 点击 2024-07-02 15:26

【深度】通向AGI的钥匙：10万H100超级AI算力集群

10万张H100卡构成的超级AI算力集群就像是现代人类文明的奇观，是人类通向AGI的钥匙。AI时代的军备竞赛已经拉开帷幕，赌注是天量的Capex支出，胜者则有机会成为AI时代的造物主。

来自主题: AI技术研报

11971 点击 2024-07-02 14:58

8B尺寸达到GPT-4级性能！北大等提出医疗专家模型训练方法

本文研究发现大语言模型在持续预训练过程中出现目标领域性能先下降再上升的现象。

来自主题: AI技术研报

9846 点击 2024-07-02 11:27

人刚毕业，颠覆整个AI界：扒一扒Sora两带头人博士论文

看看这个时代最伟大 AI 学者的研究脉络。

来自主题: AI技术研报

6922 点击 2024-07-02 00:58

拆分Transformer注意力，韩国团队让大模型解码提速20倍

只要将注意力切块，就能让大模型解码提速20倍。

来自主题: AI技术研报

10916 点击 2024-07-01 15:34

ICML 2024 Spotlight | 在解码中重新对齐，让语言模型更少幻觉、更符合人类偏好

本文介绍了一篇语言模型对齐研究的论文，由瑞士、英国、和法国的三所大学的博士生和 Google DeepMind 以及 Google Research 的研究人员合作完成。

来自主题: AI技术研报

10350 点击 2024-07-01 15:17

等不来OpenAI的Q*，华为诺亚探索LLM推理的秘密武器MindStar先来了

人工智能（AI）在过去十年里取得了长足进步，特别是在自然语言处理和计算机视觉领域。然而，如何提升 AI 的认知能力和推理能力，仍然是一个巨大的挑战。

来自主题: AI技术研报

10270 点击 2024-07-01 15:13

人刚毕业，颠覆整个AI界：扒一扒Sora两带头人博士论文

看看这个时代最伟大 AI 学者的研究脉络。

来自主题: AI技术研报

9273 点击 2024-07-01 14:26

迄今最快的网络流算法，网友：几乎与数学理论一样快

迄今为止最快、近乎完美的网络流（Network Flow）算法，来了！

来自主题: AI技术研报

10392 点击 2024-07-01 13:42

30倍于传统方法，中国科学院团队Transformer深度学习模型预测糖-蛋白质作用位点

糖类是自然界中最丰富的有机物质，对生命至关重要。了解糖类如何在生理和病理过程中调节蛋白质，可以为解决关键的生物学问题和开发新的治疗方法提供机遇。

来自主题: AI技术研报

11144 点击 2024-07-01 13:30

亚马逊云创新「神经稀疏检索」：仅需要文本匹配就能实现语义搜索

自从大模型爆火以来，语义检索也逐渐成为一项热门技术。尤其是在 RAG（retrieval augmented generation）应用中，检索结果的相关性直接决定了 AI 生成的最终效果。

来自主题: AI技术研报

10534 点击 2024-07-01 13:27

从零开始，用英伟达T4、A10训练小型文生视频模型，几小时搞定

很翔实的一篇教程。

来自主题: AI技术研报

10134 点击 2024-07-01 13:25

AI小分子药物发现的「百科全书」，康奈尔、剑桥、EPFL等研究者综述登Nature子刊

随着 AI for Science 受到越来越多的关注，人们更加关心 AI 如何解决一系列科学问题并且可以被成功借鉴到其他相近的领域。

来自主题: AI技术研报

5158 点击 2024-06-29 18:06

ICML 2024｜Transformer究竟如何推理？基于样例还是基于规则

文章第一作者为来自北京大学物理学院、即将加入人工智能研究院读博的胡逸。胡逸的导师为北京大学人工智能研究院助理教授、北京通用人工智能研究院研究员张牧涵，主要研究方向为图机器学习和大模型的推理和微调。

来自主题: AI技术研报

10222 点击 2024-06-29 17:53

看张手绘草图就能合成图形程序，加州伯克利让扩散模型掌握新技能

事实证明，扩散模型不仅能用于生成图像和视频，也能用于合成新程序。

来自主题: AI技术研报

5947 点击 2024-06-29 17:49

300多篇相关研究，复旦、南洋理工最新多模态图像编辑综述论文

本文提出了解决一般性编辑任务的统一框架！近期，复旦大学 FVL 实验室和南洋理工大学的研究人员对于多模态引导的基于文生图大模型的图像编辑算法进行了总结和回顾。综述涵盖 300 多篇相关研究，调研的最新模型截止至今年 6 月！

来自主题: AI技术研报

9043 点击 2024-06-29 00:35

谷歌「诚意之作」，开源9B、27B版Gemma2，主打高效、经济！

性能翻倍的Gemma 2，让同量级的Llama3怎么玩？

来自主题: AI技术研报

9205 点击 2024-06-29 00:27

Bengio团队提出多模态新基准，直指Claude 3.5和GPT-4o弱点

想要达成通用人工智能 AGI 的终极目标，首先要达成的是模型要能完成人类所能轻松做到的任务。为了做到这一点，大模型开发的关键指导之一便是如何让机器像人类一样思考和推理。诸如注意力机制和思维链（Chain-of-Thought）等技术正是由此产生的灵感。

来自主题: AI技术研报

9017 点击 2024-06-29 00:14

陈丹琦团队图表解读新基准：新王Claude3.5刚及格，但已是模型最强推理表现

Claude 3.5 Sonnet的图表推理能力，比GPT-4o高出了27.8%。针对多模态大模型在图表任务上的表现，陈丹琦团队提出了新的测试基准。新Benchmark比以往更有区分度，也让一众传统测试中的高分模型暴露出了真实能力。

来自主题: AI技术研报

10570 点击 2024-06-29 00:07

谷歌开源系模型第二代免费开放！27B媲美LLaMA3 70B，单H100或TPU主机可跑

谷歌开源模型Gemma 2开放了！虽然前段时间Google I/O大会上，Gemma 2开源的消息就已经被放出，但谷歌还留了个小惊喜—— 除27B模型外，还有一个更轻的9B版本。 DeepMind创始人哈萨比斯表示，27B参数规模下，Gemma 2提供了同类模型最强性能，甚至还能与其两倍大的模型竞争。

来自主题: AI技术研报

9412 点击 2024-06-29 00:02

AI首次实时生成视频！尤洋团队新作，网友：这是新纪元

尤洋团队新作，首个基于DiT的实时视频生成方法来了！

来自主题: AI技术研报

10502 点击 2024-06-28 23:56

华东师范大学的老师，上课已经用上了大模型

人在华东师范大学，上课、教学已经用上了大模型。

来自主题: AI技术研报

11481 点击 2024-06-28 22:00

LLM最喜欢的随机数是什么？答案竟是ta！

计算机程序可以生成很像真随机的「伪随机数」，而LLM表示，干脆不装了，我就有自己最喜欢的数。

来自主题: AI技术研报

9703 点击 2024-06-28 16:37

比LERF提速199倍！清华哈佛发布LangSplat：三维语义高斯泼溅 | CVPR 2024 Highlight

本文将为大家介绍CVPR 2024 Highlight的论文LangSplat: 3D Language Gaussian Splatting（三维语义高斯泼溅）。LangSplat在开放文本目标定位和语义分割任务上达到SOTA性能。在1440×1080分辨率的图像上，查询速度比之前的SOTA方法LERF快了199倍。代码已开源。

来自主题: AI技术研报

5556 点击 2024-06-28 16:31