AI资讯新闻榜单内容搜索-音频大模型

A16z 4100万美元领投Mirelo，重磅押注欧洲音频大模型

欧洲音频公司 Mirelo AI 刚刚拿下 4100 万美元种子轮，由 a16z 与 Index Ventures 领投。他们不是再做一个剪辑工具，而是训练自己的音频模型，主打用户给视频，Mirelo 补上所有声音。自动生成音效与配乐，并把它们精确同步到画面上。

来自主题: AI资讯

9330 点击 2025-12-27 14:29

不难发现，近几个月，开源频频成为 AI 社区热议的焦点。尤其是对于国内科技公司来说，开源成为主旋律。根据 Hugging Face 中文 AI 模型与资源社区的数据显示，国内厂商在七八月接连开源 33 款、31 款各类型大模型。

来自主题: AI资讯

10930 点击 2025-09-19 09:22

用AI来整理会议内容，已经是人类的常规操作。不过，你猜怎么着？面对1000道多步骤音频推理题时，30款AI模型竟然几乎全军覆没，很多开源模型表现甚至接近瞎猜。

来自主题: AI技术研报

10418 点击 2025-06-09 14:43

首个专为ALLMs（音频大语言模型）设计的多维度可信度评估基准来了。

来自主题: AI技术研报

11058 点击 2025-06-03 15:11

WaveForms致力于开发音频大模型（LLMs），通过创新的端到端音频处理技术，实现更加实时、类人化且情感智能化的语音交互。与传统语音模型不同，WaveForms的音频模型不是语音转文本再转语音，而是能够直接处理音频，实现更自然的对话和情感互动。

来自主题: AI资讯

6775 点击 2025-01-22 10:01

Stable Audio Open：开源文本转音频模型。

来自主题: AI资讯

5450 点击 2024-07-25 11:09

通义千问开源全家桶正式上线！业界最强72B模型直接超越开源标杆Llama 2-70B，还有1.8B模型、音频大模型全部开源，阿里云这次真的把家底都掏出来了。

来自主题: AI资讯

9251 点击 2023-12-02 11:32