
「音乐界Sora」Udio来了:前DeepMind员工创业,比Suno可定制性更强
「音乐界Sora」Udio来了:前DeepMind员工创业,比Suno可定制性更强我们已经看到,AI 已经能够理解和生成文本、图像、视频,尽管各个产品目前能达到的准确性和审美水准还不相同
我们已经看到,AI 已经能够理解和生成文本、图像、视频,尽管各个产品目前能达到的准确性和审美水准还不相同
前两天刚刚疯传的Suno挑战者、“音乐版Sora”正式现真身: 正式名称Udio,已完全免费开放,每人每月有足足1200首额度,网友们都玩疯了。
相比于 AI 文字、图片,甚至是视频赛道,AI 音乐生成一直是一个关注度比较低的赛道,但是其实,创业者们很早就开始进行尝试了。
谷歌最强大模型Gemini 1.5 Pro今天起,“全面”对外开放。 目前完全免费,开发者可以通过API调用的方式使用,普通玩家也可以在谷歌AI Studio中直接体验。
这两天,一个神秘的“音乐版Sora”产品被盛传即将发布,Suno和它比起来都不算什么。
200名音乐人联名信抗议的消息刚出,Stability AI的新音乐工具就来了!刚刚发布的Stable Audio 2.0,可以创作长达3分钟的音乐,哼哼几句就能给你创作出一段音乐了!不过广大网友和音乐人试用后表示:有点失望……
AI人才争夺战拉响!谷歌四大高管挖走了OpenAI前开发者关系负责人Logan Kilpatrick。他将AI Studio产品,并为Gemini API提供支持。网友纷纷看好谷歌。
国产Sora来了!这家公司的AI视频已经实现了15秒4K 60帧的超逼真效果。而且,它和小米、快手都已展开战略合作,瞄准了500亿美元的短剧出海市场。
Sora还没开放,但网友们用Runway、Pika等工具做出的电影级大片已经「上线」,B站西游记的浏览量快破百万了!另外,Lightricks今天推出的革命性AI电影制作平台LTX Studio,让我们可以亲手DIY电影级大片了。
在文本生成音频(或音乐)这个 AIGC 赛道,Meta 最近又有了新研究成果,而且开源了。前几日,在论文《Masked Audio Generation using a Single Non-Autoregressive Transformer》中,Meta FAIR 团队、Kyutai 和希伯来大学推出了 MAGNeT,一种在掩码生成序列建模方法。