AI技术研报-这里有最前沿的人工智能技术解读

张鹏对话无问芯穹夏立雪：中国的Scaling Law是场景优势，异构算力解决大模型落地难题

CUDA 是英伟达的壁垒，推理场景是算力未来的重点

来自主题: AI技术研报

4674 点击 2024-04-16 13:26

北大字节开辟图像生成新范式！超越Sora核心组件DiT，不再预测下一个token

提出图像生成新范式，从预测下一个token变成预测下一级分辨率，效果超越Sora核心组件Diffusion Transformer（DiT

来自主题: AI技术研报

8087 点击 2024-04-15 18:16

融合ChatGPT+DALL·E 3，贾佳亚团队新作开源畅玩：识图推理生图一站解决

在开源社区中把GPT-4+Dall·E 3能⼒整合起来的模型该有多强？

来自主题: AI技术研报

7230 点击 2024-04-15 18:07

陶哲轩力荐！史上最全「数学AI资源」清单出炉

史上最全的「数学人工智能资源」清单出炉了。陶哲轩，信奉AI将在2026年成为人类数学家的重要合著者，一早便转发了这份清单。

来自主题: AI技术研报

5987 点击 2024-04-15 17:29

一阶优化算法启发，北大林宙辰团队提出具有万有逼近性质的神经网络架构的设计方法

以神经网络为基础的深度学习技术已经在诸多应用领域取得了有效成果

来自主题: AI技术研报

6138 点击 2024-04-15 15:20

还在卷长文本？谷歌最新论文直接把文本干到…无限长了

通过这项技术，能使transformer大模型在有限的计算资源条件下，处理无限长度的输入。

来自主题: AI技术研报

6123 点击 2024-04-15 15:15

曾爆火的 InstantID又有了新玩法：风格化图像生成，已开源

风格化图像生成，也常称为风格迁移，其目标是生成与参考图像风格一致的图像。

来自主题: AI技术研报

4722 点击 2024-04-14 17:48

马斯克的首款多模态大模型来了，GPT-4V又被超越了一次

自从 2023 年 11 月 Grok 首次亮相以来，马斯克的 xAI 正在大模型领域不断取得进步，向 OpenAI 等先行者发起进攻。在 Grok-1 开源后不到一个月，xAI 的首个多模态模型就问世了。

来自主题: AI技术研报

11063 点击 2024-04-14 17:41

Claude 3说服力堪比人类！Anthropic最新研究揭秘LLM惊人能力

人工智能模型在对话说服力方面表现如何？

来自主题: AI技术研报

9454 点击 2024-04-14 17:26

液体都“智能”可编程了？哈佛新型超材料登Nature，粘度、透明度、弹性可变

液体都有“智能”、可编程了？最近，一种被称为“智能"液体的多功能可编程的新型超材料——Metafluid，登上了Nature。

来自主题: AI技术研报

9435 点击 2024-04-14 17:11

剑指Sora！120秒超长AI视频模型免费开玩

120秒超长AI视频模型来了！不但比Sora长，而且免费开源

来自主题: AI技术研报

7510 点击 2024-04-14 15:41

GPT超越扩散、视觉生成Scaling Law时刻！北大&字节提出VAR范式

新一代视觉生成范式「VAR: Visual Auto Regressive」视觉自回归来了

来自主题: AI技术研报

8092 点击 2024-04-14 15:01

CVPR 2024 | 仅需文本或图像提示，新框架CustomNeRF精准编辑3D场景

自 2020 年神经辐射场 (Neural Radiance Field, NeRF) 提出以来，将隐式表达推上了一个新的高度。作为当前最前沿的技术之一

来自主题: AI技术研报

4383 点击 2024-04-14 14:04

谁说大象不能起舞! 重编程大语言模型实现跨模态交互的时序预测 | ICLR 2024

近，来自澳大利亚蒙纳士大学、蚂蚁集团、IBM 研究院等机构的研究人员探索了模型重编程 (model reprogramming) 在大语言模型 (LLMs) 上应用，并提出了一个全新的视角

来自主题: AI技术研报

7716 点击 2024-04-14 13:07

改变LoRA的初始化方式，北大新方法PiSSA显著提升微调效果

随着大模型的参数量日益增长，微调整个模型的开销逐渐变得难以接受。为此，北京大学的研究团队提出了一种名为 PiSSA 的参数高效微调方法，在主流数据集上都超过了目前广泛使用的 LoRA 的微调效果。

来自主题: AI技术研报

10620 点击 2024-04-13 16:50

直接扩展到无限长，谷歌Infini-Transformer终结上下文长度之争

谷歌又放大招了，发布下一代 Transformer 模型 Infini-Transformer。

来自主题: AI技术研报

9539 点击 2024-04-13 16:44

CVPR 2024 | 分割一切模型SAM泛化能力差？域适应策略给解决了

第一个针对「Segment Anything」大模型的域适应策略来了！相关论文已被CVPR 2024 接收。

来自主题: AI技术研报

9187 点击 2024-04-09 16:22

杨笛一新作：社恐有救了，AI大模型一对一陪聊，帮i人变成e人

在社交活动中，大语言模型既可以是你的合作伙伴（partner），也可以成为你的导师（mentor）。在人类的社交活动中，为了更有效地在工作和生活中与他人沟通，需要一定的社交技能，比如解决冲突。

来自主题: AI技术研报

6858 点击 2024-04-09 16:16

纯C语言手搓GPT-2，前OpenAI、特斯拉高管新项目火了

「Real men program in C.」众所周知，大语言模型还在快速发展，应该有很多可以优化的地方。我用纯 C 语言来写，是不是能优化一大截？也许很多人开过这样的脑洞，现在有大佬实现了。

来自主题: AI技术研报

3213 点击 2024-04-09 16:10

破解36年前魔咒！Meta推出反向训练大法消除大模型「逆转诅咒」

大语言模型的「逆转诅咒」，被解开了。近日，来自Meta FAIR的研究人员推出了反向训练大法，让模型从反方向上学到了事实之间的逻辑，终于改进了这个困扰人们已久的问题。

来自主题: AI技术研报

6122 点击 2024-04-09 15:57

120亿Stable LM 2上线即开源！2万亿token训练，碾压Llama 2 70B

Stability AI推出Stable LM 2 12B模型，作为其新模型系列的进一步升级，该模型基于七种语言的2万亿Token进行训练，拥有更多参数和更强性能，据称在某些基准下能超越Llama 2 70B。

来自主题: AI技术研报

8076 点击 2024-04-09 15:44

AI攻克费马大定理？数学家放弃5年职业生涯，将100页证明变代码

困扰全世界几个世纪的「臭名昭著」谜题——费马大定理，或将被AI攻克？一位英国数学家宣布，即将启动用Lean重现费马大定理证明过程的项目，将100页证明变成代码。从此，世界顶尖数学难题的证明将成为「众包」项目，你我都可以进去添几笔。

来自主题: AI技术研报

8496 点击 2024-04-09 15:29

1000行C语言搓出GPT-2！AI大神Karpathy新项目刚上线就狂揽2.5k星

训大模型的方法可能要被革新了！AI大神Karpathy发布的新项目仅用1000行的C语言训完GPT-2，而不再依赖庞大的GPT-2库。他本人预告，即将上线新课。

来自主题: AI技术研报

6079 点击 2024-04-09 15:14

AI大模型搜索之战开启，胜出黑马竟是ta？

距离AI「杀死」搜索引擎，到底还差几步？

来自主题: AI技术研报

6239 点击 2024-04-09 14:52

AI治理观察：Sora或者ChatGPT生成的内容版权究竟归谁？

行业狂飙之际，版权利益争夺渐酣今年2月，美国OpenAI公司发布了首个视频生成模型“Sora”，再次掀起全球追进生成式人工智能的热潮。然而，据《纽约时报》近日报道，科技巨头OpenAI和谷歌被指涉嫌使用YouTube视频的转录文本来训练其人工智能模型，这一行为可能侵犯了YouTube创作者的版权。

来自主题: AI技术研报

9115 点击 2024-04-09 11:19

用AI软件识别毒蘑菇？AI犯错后，人吃下了毒鹅膏，差点要了命……

AI还教人烹饪毒鹅膏如今，AI技术正在被广泛地用于我们生活中的方方面面，但是有科学家提醒大家，目前还是先不要把你的健康托付给一些APP，因为它们很有可能会犯错，甚至有可能要了人的命。

来自主题: AI技术研报

7684 点击 2024-04-09 11:14

大模型投资2024：阿里腾讯，争做一号“金主”

宁可犯错，不愿错过。以国内大模型初创企业主要投资方的身份，腾讯和阿里再次站在了“金主爸爸”的位置。

来自主题: AI技术研报

7459 点击 2024-04-09 11:09

邪恶大模型多到离谱，黑客通过后门攻击操纵大模型，BadGPT 时代来了？

不是大模型变坏了，是用大模型的人变坏了。

来自主题: AI技术研报

6154 点击 2024-04-09 11:04

GPT-4推理能力为0？开发者悬赏1万美金被打脸，神秘提示正确率直冲100%

小孩子都会的脑筋急转弯推理题，GPT-4和Claude 3做不出？国外一位开发者小哥坚称这一观点，认为GPT模型在训练集外毫无推理能力，无法实现AGI，甚至悬赏1万美元，发起比赛。然而，他当天就被光速打脸了！网友用高能的prompt，让GPT-4和Claude 3几乎达到百分百的正确率。

来自主题: AI技术研报

5695 点击 2024-04-09 10:32

AI颠覆数学研究！菲尔兹奖得主、华裔数学家领衔11篇顶刊论文｜陶哲轩转赞

毫无疑问，数学家的工作方式，正在被AI颠覆！陶哲轩转发的这期美国数学学会通报，大咖云集，星光璀璨。针对AI改变数学的议题，他们中有降临派，也有怀疑论者。而陶哲轩也直接高呼：这个领域太快了，现在我没发表的论文已经不够看了！

来自主题: AI技术研报

5000 点击 2024-04-09 10:08