AI资讯新闻榜单内容搜索-CV

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: CV
北大王选所:让多模态大模型更懂人类在做什么|ECCV 2024

北大王选所:让多模态大模型更懂人类在做什么|ECCV 2024

北大王选所:让多模态大模型更懂人类在做什么|ECCV 2024

只用提示词,多模态大模型就能更懂场景中的人物关系了。

来自主题: AI技术研报
9551 点击    2024-08-13 16:56
ECCV 2024 | 南洋理工三维数字人生成新范式:结构扩散模型

ECCV 2024 | 南洋理工三维数字人生成新范式:结构扩散模型

ECCV 2024 | 南洋理工三维数字人生成新范式:结构扩散模型

三维数字人生成和编辑在数字孪生、元宇宙、游戏、全息通讯等领域有广泛应用。传统三维数字人制作往往费时耗力,近年来研究者提出基于三维生成对抗网络(3D GAN)从 2D 图像中学习三维数字人,极大提高了数字人制作效率。

来自主题: AI资讯
4174 点击    2024-08-12 17:55
ICML 2024 | 人物交互图像,现在更懂你的提示词了,北大推出基于语义感知的人物交互图像生成框架

ICML 2024 | 人物交互图像,现在更懂你的提示词了,北大推出基于语义感知的人物交互图像生成框架

ICML 2024 | 人物交互图像,现在更懂你的提示词了,北大推出基于语义感知的人物交互图像生成框架

该论文的第一作者和通讯作者均来自北京大学王选计算机研究所的 MIPL实验室,第一作者为博士生徐铸,通讯作者为博士生导师刘洋。MIPL 实验室近年来在 IJCV、CVPR、AAAI、ICCV、ICML、ECCV 等顶会上有多项代表性成果发表,多次荣获国内外 CV 领域重量级竞赛的冠军奖项,和国内外知名高校、科研机构广泛开展合作。

来自主题: AI技术研报
5000 点击    2024-08-08 18:44
CV又不存在了?Meta「分割一切」2.0正式开源,视频也能分割了

CV又不存在了?Meta「分割一切」2.0正式开源,视频也能分割了

CV又不存在了?Meta「分割一切」2.0正式开源,视频也能分割了

Meta又双叒开源了!继去年初代SAM掀翻CV圈之后,SAM 2也完成了终极进化,不仅能分割图像,最惊艳的是还能分割视频。这下,CV可能就真的不存在了。

来自主题: AI技术研报
6247 点击    2024-07-31 14:42
刚刚,Meta开源「分割一切」2.0模型,视频也能分割了

刚刚,Meta开源「分割一切」2.0模型,视频也能分割了

刚刚,Meta开源「分割一切」2.0模型,视频也能分割了

还记得 Meta 的「分割一切模型」吗?这个模型在去年 4 月发布,被很多人认为是颠覆传统 CV 任务的研究。

来自主题: AI资讯
9609 点击    2024-07-30 16:28
ECCV 2024|是真看到了,还是以为自己看到了?多模态大模型对文本预训练知识的过度依赖该解决了

ECCV 2024|是真看到了,还是以为自己看到了?多模态大模型对文本预训练知识的过度依赖该解决了

ECCV 2024|是真看到了,还是以为自己看到了?多模态大模型对文本预训练知识的过度依赖该解决了

随着大型语言模型(LLMs)的进步,多模态大型语言模型(MLLMs)迅速发展。它们使用预训练的视觉编码器处理图像,并将图像与文本信息一同作为 Token 嵌入输入至 LLMs,从而扩展了模型处理图像输入的对话能力。这种能力的提升为自动驾驶和医疗助手等多种潜在应用领域带来了可能性。

来自主题: AI技术研报
8492 点击    2024-07-27 19:33
ECCV 2024|盲视频去闪烁通用方法BlazeBVD来了,美图&国科大联合提出

ECCV 2024|盲视频去闪烁通用方法BlazeBVD来了,美图&国科大联合提出

ECCV 2024|盲视频去闪烁通用方法BlazeBVD来了,美图&国科大联合提出

近年,短视频生态的赛道迅猛崛起,围绕短视频而生的创作编辑工具在不断涌现,美图公司旗下专业手机视频编辑工具 ——Wink,凭借独创的视频画质修复能力独占鳌头,海内外用户量持续攀升。

来自主题: AI技术研报
3837 点击    2024-07-23 16:43