
ECCV2024 Oral | 第一视角下的动作图像生成,Meta等提出LEGO模型
ECCV2024 Oral | 第一视角下的动作图像生成,Meta等提出LEGO模型如何基于用户的问题和当前场景的照片,生成同一场景下的第一视角的动作图像,从而更准确地指导用户执行下一步行动?
如何基于用户的问题和当前场景的照片,生成同一场景下的第一视角的动作图像,从而更准确地指导用户执行下一步行动?
本论文第一作者倪赞林是清华大学自动化系 2022 级直博生,师从黄高副教授,主要研究方向为高效深度学习与图像生成。他曾在 ICCV、CVPR、ECCV、ICLR 等国际会议上发表多篇学术论文。
备受期待的阶跃星辰图像生成大模型Step-1X,正式上线了!创作古诗词配图意境绝美,古典中国园林的每片叶子都很逼真,巴黎街道堪比单反。而且,这次官方还披露了两个隐藏玩法,让生图效果噌噌up。
AI圈,再次开卷图像生成。
在人工智能领域,图像生成技术一直是一个备受关注的话题。近年来,扩散模型(Diffusion Model)在生成逼真且复杂的图像方面取得了令人瞩目的进展。然而,技术的发展也引发了潜在的安全隐患,比如生成有害内容和侵犯数据版权。这不仅可能对用户造成困扰,还可能涉及法律和伦理问题。
由于Grok的图像生成功能没有任何限制,已经有不少用户借此进行政治人物图像创作,但ChatGPT会拒绝生成这类图像。
大家还记得 Stable Diffusion嘛,就是那个曾经和 DALL·E 、 Midjourney 齐名的图像生成 AI 。
该论文的第一作者和通讯作者均来自北京大学王选计算机研究所的 MIPL实验室,第一作者为博士生徐铸,通讯作者为博士生导师刘洋。MIPL 实验室近年来在 IJCV、CVPR、AAAI、ICCV、ICML、ECCV 等顶会上有多项代表性成果发表,多次荣获国内外 CV 领域重量级竞赛的冠军奖项,和国内外知名高校、科研机构广泛开展合作。
最强开源文生图模型一夜易主! 智东西8月2日报道,昨日晚间,开源文生图模型霸主Stable Diffusion原班人马,宣布推出全新的图像生成模型FLUX.1。
AI 图像生成平台「LiblibAI 哩布哩布 AI」在一年内已完成三轮融资,总金额达数亿元人民币。