
AI「视觉图灵」时代来了!字节OmniHuman,一张图配上音频,就能直接生成视频
AI「视觉图灵」时代来了!字节OmniHuman,一张图配上音频,就能直接生成视频还记得半年前在 X 上引起热议的肖像音频驱动技术 Loopy 吗?升级版技术方案来了,字节跳动数字人团队推出了新的多模态数字人方案 OmniHuman, 其可以对任意尺寸和人物占比的单张图片结合一段输入的音频进行视频生成,生成的人物视频效果生动,具有非常高的自然度。
来自主题: AI技术研报
6013 点击 2025-02-06 13:11