
画到哪,动到哪!字节跳动发布视频生成「神笔马良」ATI,已开源!
画到哪,动到哪!字节跳动发布视频生成「神笔马良」ATI,已开源!近年来,随着扩散模型(Diffusion Models)、Transformer 架构与高性能视觉理解模型的蓬勃发展,视频生成任务取得了令人瞩目的进展。从静态图像生成视频的任务(Image-to-Video generation)尤其受到关注,其关键优势在于:能够以最小的信息输入生成具有丰富时间连续性与空间一致性的动态内容。
近年来,随着扩散模型(Diffusion Models)、Transformer 架构与高性能视觉理解模型的蓬勃发展,视频生成任务取得了令人瞩目的进展。从静态图像生成视频的任务(Image-to-Video generation)尤其受到关注,其关键优势在于:能够以最小的信息输入生成具有丰富时间连续性与空间一致性的动态内容。
AinimateLab的总监周士诚今年有两部AI短片斩获佳绩——《缸中之脑》获得今年北京国际电影节AIGC单元最佳动画;《我的外星女友》则入围了今年上海国际电影节AIGC短片单元六强。
AI浏览器正成为AI时代竞争的关键入口,其角色从信息窗口转变为融合搜索、决策与执行的智能伙伴。浏览器形态成为AI助手(如豆包)、AI搜索(如夸克)、AI知识库(如ima)及Agent工具(如扣子空间)的共同选择。
清华大学朱军教授团队与 NVIDIA Deep Imagination 研究组联合提出一种全新的视觉生成模型优化范式 —— 直接判别优化(DDO)。
谷歌把最新的文生图模型 Imagen 4,以及它的 Pro Max 版 Imagen 4 Ultra,放到了 AI Studio 和 API 里。
今天,Gemini 家族迎来了一个新成员:Gemini Robotics On-Device。这是谷歌 DeepMind 首个可以直接部署在机器人上的视觉-语言-动作(VLA)模型,可以帮助机器人更快、更高效地适应新任务和环境,同时无需持续的互联网连接。
大家周末好呀!MiniMax 本周也像之前OpenAI 和 DeepSeek开启了一次为期 5 天的发布周,发布了不少干货。
AI独角兽稀宇科技(MiniMax)正考虑在香港进行首次公开募股(IPO)。
顺利上IPO的岸之前,六小虎的营收先要接受拷问。
满场观众瞩目之下,体操运动员稳稳完成一个跳步动作,然后……突然来了段木上芭蕾???