
轨迹可控视频生成新范式,复旦微软破解视频生成难题,精准控制任意物体运动
轨迹可控视频生成新范式,复旦微软破解视频生成难题,精准控制任意物体运动轨迹可控的视频生成来了,支持三种不同级别的轨迹控制条件——分别为掩码、边界框和稀疏框。研究人员提出了MagicMotion,一种创新的图像到视频生成框架,共同第一作者为复旦大学研究生李全昊、邢桢,通讯作者为复旦大学吴祖煊副教授。
轨迹可控的视频生成来了,支持三种不同级别的轨迹控制条件——分别为掩码、边界框和稀疏框。研究人员提出了MagicMotion,一种创新的图像到视频生成框架,共同第一作者为复旦大学研究生李全昊、邢桢,通讯作者为复旦大学吴祖煊副教授。
近年来,扩散模型在图像与视频合成领域展现出强大能力,为图像动画技术的发展带来了新的契机。特别是在人物图像动画方面,该技术能够基于一系列预设姿态驱动参考图像,使其动态化,从而生成高度可控的人体动画视频。
自由与好奇心是学术研究最宝贵的特质,正是对未知的执着探索,才能孕育改变世界的创新。
Neurobo(弈智交互)是一家位于上海的创业公司,获得前百度总裁、微软副总裁陆奇博士创办的奇绩创坛的投资。团队核心成员来自清华大学与日本筑波大学等海内外名校,致力于结合 LLM 与现实场景数据,让二次元用户可以将「谷子」变为随身相伴,随时触达的实体情感伴侣。
天啦噜!现在玩游戏都能进化到这种程度了??
在一场激烈对决的棋局中,OpenAI 与 GPU 资源丰富的云服务提供商 CoreWeave 签署了一项为期五年、价值 119 亿美元的协议,据路透社援引接近交易的人士透露。
微软宣布将在2027年底前追加投资54亿兰特(约2.97亿美元),扩大其在南非的云计算和人工智能(AI)基础设施,以满足Azure 云服务在该地区不断增长的需求。此外,该公司还计划为5万名南非学员提供云架构、人工智能和网络安全等高需求技能的认证考试费用,以助力本地人才发展。
微软研究院官宣开源多模态AI——Magma模型。首个能在所处环境中理解多模态输入并将其与实际情况相联系的基础模型。
思维链引发的战争。
最新开源的视觉预训练方法,马毅团队、微软研究院、UC伯克利等联合出品!