
全员离开老东家,Stable Diffusion一作带团创业,出手即击败MJ v6、SD3,还开源
全员离开老东家,Stable Diffusion一作带团创业,出手即击败MJ v6、SD3,还开源AI 图像和视频生成领域又加入了一个颇有实力的玩家。
AI 图像和视频生成领域又加入了一个颇有实力的玩家。
2024 年的 AI 图像生成技术,又提升到了一个新高度。
近日,MIT CSAIL 的一个研究团队(一作为 MIT 在读博士陈博远)成功地将全序列扩散模型与下一 token 模型的强大能力统合到了一起,提出了一种训练和采样范式:Diffusion Forcing(DF)。
2022年,美图CEO吴欣鸿将年度总结的主题,从“居安思危”改成了“居危思危”。
荷兰拉德布德大学的研究团队通过定位大脑注意力机制,在AI「读心术」领域精确生成图像,能够依据大脑活动记录极为准确地重建猕猴所看到的内容。网友:这是人机融合的最终目标。
只需几分钟、一张图或一句话,就能完成时空一致的4D内容生成。
此前Stability AI曾陷入债务危机,经营亏损,多位高层人员流失。
在生成式模型的迅速发展中,Image Tokenization 扮演着一个很重要的角色,例如Diffusion依赖的VAE或者是Transformer依赖的VQGAN。这些Tokenizers会将图像编码至一个更为紧凑的隐空间(latent space),使得生成高分辨率图像更有效率。
拯救4bit扩散模型精度,仅需时间特征维护——以超低精度量化技术重塑图像内容生成!
2024 年 5 月,DreamTech 官宣了其高质量 3D 生成大模型 Direct3D,并公开了相关学术论文 Direct3D: Scalable Image-to-3D Generation via 3D Latent Diffusion Transformer。