AI资讯新闻榜单内容搜索-音频模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 音频模型
A16z 4100万美元领投Mirelo,重磅押注欧洲音频大模型

A16z 4100万美元领投Mirelo,重磅押注欧洲音频大模型

A16z 4100万美元领投Mirelo,重磅押注欧洲音频大模型

欧洲音频公司 Mirelo AI 刚刚拿下 4100 万美元种子轮,由 a16z 与 Index Ventures 领投。他们不是再做一个剪辑工具,而是训练自己的音频模型,主打用户给视频,Mirelo 补上所有声音。自动生成音效与配乐,并把它们精确同步到画面上。

来自主题: AI资讯
8149 点击    2025-12-27 14:29
完爆ChatGPT!谷歌这招太狠:连你的「阴阳怪气」都能神还原

完爆ChatGPT!谷歌这招太狠:连你的「阴阳怪气」都能神还原

完爆ChatGPT!谷歌这招太狠:连你的「阴阳怪气」都能神还原

谷歌发布Gemini 2.5 Flash原生音频模型,不仅能保留语调进行实时语音翻译,更让AI在复杂指令和连续对话中像真人一样自然流畅。这一更新标志着AI从简单的「文本转语音」跨越到了真正的「拟人化交互」时代。

来自主题: AI资讯
9089 点击    2025-12-15 11:36
Mistral发布首款开源AI音频模型Voxtral​

Mistral发布首款开源AI音频模型Voxtral​

Mistral发布首款开源AI音频模型Voxtral​

随着 AI 系统越来越强大,人们与机器的交流方式也在发生变化。语音,正在迅速成为默认的交互入口。

来自主题: AI资讯
8222 点击    2025-07-16 16:32
速递|Stability AI联手Arm推出最快手机端免云模型,8秒生成11秒音频

速递|Stability AI联手Arm推出最快手机端免云模型,8秒生成11秒音频

速递|Stability AI联手Arm推出最快手机端免云模型,8秒生成11秒音频

AI 初创公司 Stability AI 发布了名为 Stable Audio Open Small 的“立体声”音频生成 AI 模型,该公司宣称这是市场上速度最快的模型,且效率高到足以在智能手机上运行。

来自主题: AI资讯
9419 点击    2025-05-15 14:14
OpenAI深夜发布3个全新的语音模型,一手实测都在这了。

OpenAI深夜发布3个全新的语音模型,一手实测都在这了。

OpenAI深夜发布3个全新的语音模型,一手实测都在这了。

就在刚刚,OpenAI 宣布在其 API 中推出全新一代音频模型,包括语音转文本和文本转语音功能,让开发者能够轻松构建强大的语音 Agent。据 OpenAI 介绍,新推出的 gpt-4o-transcribe 采用多样化、高质量音频数据集进行了长时间的训练,能更好地捕获语音细微差别,减少误识别,大幅提升转录可靠性。

来自主题: AI资讯
10882 点击    2025-03-21 08:27
ChatGPT Voice之父离职创办语音模型公司,种子轮即获a16z 4000万美金,估值数亿美元

ChatGPT Voice之父离职创办语音模型公司,种子轮即获a16z 4000万美金,估值数亿美元

ChatGPT Voice之父离职创办语音模型公司,种子轮即获a16z 4000万美金,估值数亿美元

WaveForms致力于开发音频大模型(LLMs),通过创新的端到端音频处理技术,实现更加实时、类人化且情感智能化的语音交互。与传统语音模型不同,WaveForms的音频模型不是语音转文本再转语音,而是能够直接处理音频,实现更自然的对话和情感互动。

来自主题: AI资讯
5656 点击    2025-01-22 10:01
火爆全球的AI音频大模型,最新技术细节揭秘

火爆全球的AI音频大模型,最新技术细节揭秘

火爆全球的AI音频大模型,最新技术细节揭秘

Stable Audio Open:开源文本转音频模型。

来自主题: AI资讯
4476 点击    2024-07-25 11:09