AI资讯新闻榜单内容搜索-AI语音

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: AI语音
雷军国庆将网友“骂”了整整七天,AI语音方向错了?

雷军国庆将网友“骂”了整整七天,AI语音方向错了?

雷军国庆将网友“骂”了整整七天,AI语音方向错了?

只需3秒,你的声音就能被完美克隆。 谁能想到科技圈顶流之一的雷军,居然因为AI语音引起互联网热议?

来自主题: AI资讯
3593 点击    2024-10-09 10:59
AI语音独角兽遭机构争抢,或将估值30亿美元,ARR的38倍

AI语音独角兽遭机构争抢,或将估值30亿美元,ARR的38倍

AI语音独角兽遭机构争抢,或将估值30亿美元,ARR的38倍

据TechCrunch报道,投资者们正争相进入 ElevenLabs,该公司可能很快就会被估值为 30 亿美元。

来自主题: AI资讯
2254 点击    2024-10-05 11:43
OpenAI 开发者大会!实时语音功能有API了,GPT-4o支持多模态微调,上下文cache功能上线

OpenAI 开发者大会!实时语音功能有API了,GPT-4o支持多模态微调,上下文cache功能上线

OpenAI 开发者大会!实时语音功能有API了,GPT-4o支持多模态微调,上下文cache功能上线

十一假期第1天, OpenAI一年一度的开发者大会又来了惹!今年的开发者大会分成三部分分别在美国、英国、新加坡三个地点举办,刚刚结束的是第一场。

来自主题: AI资讯
3026 点击    2024-10-03 13:07
遭GPT-4o碾压,豆包们直面语音AI生死战

遭GPT-4o碾压,豆包们直面语音AI生死战

遭GPT-4o碾压,豆包们直面语音AI生死战

在算力资源的匮乏下,中国的实时语音AI正面临着一场艰难的较量,试图在技术舞台上与GPT-4o一决高下,这无疑是当前中国AI版图中的尴尬局面。

来自主题: AI资讯
3456 点击    2024-10-01 11:25
150万条多语种音频数据!浙大清华发布语音伪造检测框架SafeEar,兼顾隐私保护|CCS 2024

150万条多语种音频数据!浙大清华发布语音伪造检测框架SafeEar,兼顾隐私保护|CCS 2024

150万条多语种音频数据!浙大清华发布语音伪造检测框架SafeEar,兼顾隐私保护|CCS 2024

SafeEar是一种内容隐私保护的语音伪造检测方法,其核心是设计基于神经音频编解码器的解耦模型,分离语音声学与语义信息,仅利用声学信息检测,包括前端解耦模型、瓶颈层和混淆层、伪造检测器、真实环境增强四部分。

来自主题: AI技术研报
9555 点击    2024-09-26 15:25
讯飞版「Her」横空出世全民开放!百变人设逼真丝滑,情绪价值逆天

讯飞版「Her」横空出世全民开放!百变人设逼真丝滑,情绪价值逆天

讯飞版「Her」横空出世全民开放!百变人设逼真丝滑,情绪价值逆天

OpenAI的「Her」还是期货,讯飞星火版「Her」就抢先上线了!不仅极速响应自由打断,还情绪价值拉满,各种情感、风格、方言随意切换。熊二被召唤出来的时候,家里的熊孩子直接被硬控了30秒。

来自主题: AI资讯
6570 点击    2024-08-31 14:32
谷歌版Her抢跑!一键召唤Gemini,全球52亿终端被颠覆

谷歌版Her抢跑!一键召唤Gemini,全球52亿终端被颠覆

谷歌版Her抢跑!一键召唤Gemini,全球52亿终端被颠覆

OpenAI,刚被截胡了? 紧追着OpenAI的「Her」,谷歌也正式官宣:发布AI语音功能! 就在刚刚「谷歌制造」的主题演讲中,谷歌宣布推出语音模式Gemini Live。不久后,Gemini Live就会在Gemini移动应用程序中上线。 谷歌和OpenAI的军备竞赛,再一次打响。

来自主题: AI资讯
7672 点击    2024-08-14 17:58
语音克隆达到人类水平,微软全新VALL-E 2模型让DeepFake堪比配音员

语音克隆达到人类水平,微软全新VALL-E 2模型让DeepFake堪比配音员

语音克隆达到人类水平,微软全新VALL-E 2模型让DeepFake堪比配音员

继去年初的第一代VALL-E模型之后,微软最近又上新了VALL-E 2模型,标志着第一个在合成语音稳健性、相似度、自然程度等方面达到人类水平的文本到语音模型。

来自主题: AI技术研报
9912 点击    2024-07-24 21:16