速递 | 将视频初创出售给苹果的创始人,进军AI视频配音,获得近千万美金投资
速递 | 将视频初创出售给苹果的创始人,进军AI视频配音,获得近千万美金投资在翻译领域,生成性人工智能有一个巨大的机会,一家名为Panjaya的初创公司正在将这一概念提升到一个新的水平:一个超现实的基于生成性人工智能的视频配音工具,可以重现一个人用新语言说话的原始声音,同时视频和说话者的身体动作会自动调整,以自然地与新的语音模式相匹配。
在翻译领域,生成性人工智能有一个巨大的机会,一家名为Panjaya的初创公司正在将这一概念提升到一个新的水平:一个超现实的基于生成性人工智能的视频配音工具,可以重现一个人用新语言说话的原始声音,同时视频和说话者的身体动作会自动调整,以自然地与新的语音模式相匹配。
近日,卡内基梅隆大学与华盛顿大学的研究团队推出了 NaturalBench,这是一项发表于 NeurIPS'24 的以视觉为核心的 VQA 基准。它通过自然图像上的简单问题——即自然对抗样本(Natural Adversarial Samples)——对视觉语言模型发起严峻挑战。
OpenAI 的快速增长继续提升供应商和其他商业伙伴的前景,他们的销售也在迅速增长。
在当前竞争激烈的3D生成技术领域,众多科技巨头和创业公司纷纷入局,推动了技术的快速发展和应用。Cartwheel,通过其Text-to-Motion技术和自动化运动合成,为3D角色制作带来革命性的简化。
产品出海试水的好成绩,能否缓解MiniMax实际的焦虑? 近期,MinxMax的AI出海明星产品Talkie爆火,下载量超越同类产品领头羊character.ai。据媒体预测,MiniMax今年收入预计达到7000万美元,而大部分收入来自Talkie的广告。
技术大牛Harrison Kinsley(@Sentdex)刚刚完成了对XAI的Grok-beta模型的基准测试,测试结果远超预期。
AI智能体能像有机生命一样自适应演化吗?最近清华大学团队提出了AgentSquare模块化智能体设计框架,通过标准化的模块接口抽象,让AI智能体可以通过模块演化和重组高速进化,实现针对不同任务场景的自适应演进,赋能超越人类设计的智能体系统在多种评测数据集上广泛自我涌现。
近日,关于 Open AI 被投企业 Physical Intelligence (PI) 的一系列报道,让人们关注到具身智能大模型引发的机器人时代变革。
一个是开源,一个是MoE (混合专家模型)。 开源好理解,在大模型火热之后,加入战局的腾讯已经按照它自己的节奏开源了一系列模型,包括混元文生图模型等。
Ichigo[1] 是一个开放的、持续进行的研究项目,目标是将基于文本的大型语言模型(LLM)扩展,使其具备原生的“听力”能力。