AI资讯新闻榜单内容搜索-扩散模型

SIGGRAPH2024｜上科大、影眸联合提出DressCode：从文本生成3D服装板片

3D生成是生成式人工智能和计算机图形学领域最引人注目的话题之一，符合影视、游戏标准的3D生成尤其受产业界关注。在生产流程中，一般品类的3D资产往往通过手工建模或者扫描的方式制作。但作为3D资产的一个重要类别，服装资产的往往来源于平面板片与物理模拟等流程，而不是直接在3D上建模。

来自主题: AI技术研报

8609 点击 2024-06-15 15:44

Stable Diffusion 3开源秒翻车，画人好掉san

没想到……Stable Diffusion 3开源即出现翻车案例。生成一个躺在草地上的女孩，结果长这样？

来自主题: AI资讯

8037 点击 2024-06-13 21:16

CVPR 2024｜让图像扩散模型生成高质量360度场景，只需要一个语言模型

360 度场景生成是计算机视觉的重要任务，主流方法主要可分为两类，一类利用图像扩散模型分别生成 360 度场景的多个视角。由于图像扩散模型缺乏场景全局结构的先验知识，这类方法无法有效生成多样的 360 度视角，导致场景内主要的目标被多次重复生成，如图 1 的床和雕塑。

来自主题: AI技术研报

10468 点击 2024-06-11 10:02

库里杜兰特“合舞”科目三，腾讯混元团队全新图生视频模型来了

当前大家常见的视频生成是酱婶儿的：

来自主题: AI资讯

10339 点击 2024-06-11 09:51

腾讯：终于补齐了Muse系列数字人开源框架，感谢阿里！

由腾讯音乐娱乐的Lyra Lab团队开发的Muse 开源系列项目，它的最后一个模块终于来了——MusePose ！发布后却真诚致谢阿里的项目？

来自主题: AI资讯

11573 点击 2024-06-09 18:16

ICML 2024 Oral｜外部引导的深度聚类新范式

怎样才能将可爱又迷人的柯基与柴犬的图像进行区分？

来自主题: AI技术研报

9397 点击 2024-06-07 10:56

天大、南大发布LPSNet：无透镜成像下的人体三维姿态与形状估计 | CVPR 2024

天津大学与南京大学联合团队在CVPR 2024上发表了LPSNet项目，提出了一种端到端的无透镜成像下的3D人体姿态和形状估计框架，通过多尺度无透镜特征解码器和双头辅助监督机制，直接从编码后的无透镜成像数据中提取特征并提高姿态估计的准确度。

来自主题: AI技术研报

9830 点击 2024-06-06 11:29

把整个地球装进神经网络，北航团队推出全球遥感图像生成模型

北航的研究团队，用扩散模型“复刻”了一个地球？在全球的任意位置，模型都能生成多种分辨率的遥感图像，创造出丰富多样的“平行场景”。而且地形、气候、植被等复杂的地理特征，也全都考虑到了。

来自主题: AI技术研报

8451 点击 2024-06-05 23:18

物理传热启发的视觉表征模型vHeat来了，尝试突破注意力机制，兼具低复杂度、全局感受野

如何突破 Transformer 的 Attention 机制？中国科学院大学与鹏城国家实验室提出基于热传导的视觉表征模型 vHeat。将图片特征块视为热源，并通过预测热传导率、以物理学热传导原理提取图像特征。相比于基于Attention机制的视觉模型， vHeat 同时兼顾了：计算复杂度（1.5次方）、全局感受野、物理可解释性。

来自主题: AI技术研报

10242 点击 2024-06-03 17:51

Yann LeCun：ViT慢且效率低，实时图像处理还得看卷积

用卷积能做出一样好的效果。

来自主题: AI资讯

10131 点击 2024-06-01 18:57