AI资讯新闻榜单内容搜索-视频生成模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 视频生成模型
告别“音画割裂”与“人物崩坏”!AutoMV:首个听懂歌词、卡准节拍的开源全曲级MV生成Agent

告别“音画割裂”与“人物崩坏”!AutoMV:首个听懂歌词、卡准节拍的开源全曲级MV生成Agent

告别“音画割裂”与“人物崩坏”!AutoMV:首个听懂歌词、卡准节拍的开源全曲级MV生成Agent

现有的AI视频生成模型虽然在短片上效果惊人,但面对一首完整的歌曲时往往束手无策——画面不连贯、人物换脸、甚至完全不理会歌词含义。

来自主题: AI技术研报
7345 点击    2025-12-30 10:29
挖到M2.1的7个神仙用法,有点上头。。

挖到M2.1的7个神仙用法,有点上头。。

挖到M2.1的7个神仙用法,有点上头。。

上周我还在折腾各种图片、视频生成模型,这周又到了编程周。前天MiniMax丢出了个在编程界绝对有分量的模型:MiniMax-M2.1。然后发现就在刚才已经开源了:

来自主题: AI资讯
10023 点击    2025-12-27 10:56
生成不遗忘,「超长时序」世界模型!北大EgoLCD长短时记忆加持

生成不遗忘,「超长时序」世界模型!北大EgoLCD长短时记忆加持

生成不遗忘,「超长时序」世界模型!北大EgoLCD长短时记忆加持

视频生成模型总是「记性不好」?生成几秒钟后物体就变形、背景就穿帮?北大、中大等机构联合发布EgoLCD,借鉴人类「长短时记忆」机制,首创稀疏KV缓存+LoRA动态适应架构,彻底解决长视频「内容漂移」难题,在EgoVid-5M基准上刷新SOTA!让AI像人一样拥有连贯的第一人称视角记忆。

来自主题: AI技术研报
7364 点击    2025-12-25 10:16
MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law

MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law

MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law

MiniMax海螺视频团队不藏了!首次开源就揭晓了一个困扰行业已久的问题的答案——为什么往第一阶段的视觉分词器里砸再多算力,也无法提升第二阶段的生成效果?翻译成大白话就是,虽然图像/视频生成模型的参数越做越大、算力越堆越猛,但用户实际体验下来总有一种微妙的感受——这些庞大的投入与产出似乎不成正比,模型离完全真正可用总是差一段距离。

来自主题: AI技术研报
7453 点击    2025-12-22 17:07
人人都是导演:CineCtrl首个实现视频生成中的相机运镜与摄影效果统一控制

人人都是导演:CineCtrl首个实现视频生成中的相机运镜与摄影效果统一控制

人人都是导演:CineCtrl首个实现视频生成中的相机运镜与摄影效果统一控制

现有视频生成模型往往难以兼顾「运镜」与「摄影美学」的精确控制。为此,华中科技大学、南洋理工大学、商汤科技和上海人工智能实验室团队推出了 CineCtrl。作为首个统一的视频摄影控制 V2V 框架,CineCtrl 通过解耦交叉注意力机制,摆脱了多控制信号共同控制的效果耦合问题,实现了对视频相机外参轨迹与摄影效果的独立、精细、协调控制。

来自主题: AI技术研报
7900 点击    2025-12-21 12:34
全球功能最全的视频生成模型来了

全球功能最全的视频生成模型来了

全球功能最全的视频生成模型来了

坏了,阿里这波是冲着Sora 2去的!

来自主题: AI资讯
6394 点击    2025-12-18 15:12
两大模型发布!豆包大模型日均使用量突破50万亿Tokens

两大模型发布!豆包大模型日均使用量突破50万亿Tokens

两大模型发布!豆包大模型日均使用量突破50万亿Tokens

今天,在 FORCE 原动力大会上,火山引擎发布豆包大模型1.8、豆包视频生成模型 Seedance 1.5 pro。经过一年多的持续升级,豆包大模型家族在多模态理解和生成能力、Agent 能力上,已位于全球第一梯队。

来自主题: AI资讯
8860 点击    2025-12-18 13:11
一等奖20万,大佬们出题,最硬核视频生成全球挑战赛开启!

一等奖20万,大佬们出题,最硬核视频生成全球挑战赛开启!

一等奖20万,大佬们出题,最硬核视频生成全球挑战赛开启!

首个AI视频生成全球挑战赛来袭,袁粒、颜水成、程明明、田永鸿、Philip Torr多位大佬发起,20万大奖虚位以待!创作大神还是技术极客?两大赛道总有一个适合你,速速点击报名吧。

来自主题: AI资讯
8369 点击    2025-12-18 09:47
国产芯片也能跑AI视频实时生成了,商汤Seko 2.0揭秘幕后黑科技

国产芯片也能跑AI视频实时生成了,商汤Seko 2.0揭秘幕后黑科技

国产芯片也能跑AI视频实时生成了,商汤Seko 2.0揭秘幕后黑科技

自 Sora 2 发布以来,各大科技厂商迎来新一轮视频生成模型「军备竞赛」,纷纷赶在年底前推出更强的迭代版本。

来自主题: AI技术研报
5925 点击    2025-12-16 09:15