AI资讯新闻榜单内容搜索-实时语音

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 实时语音
完爆ChatGPT!谷歌这招太狠:连你的「阴阳怪气」都能神还原

完爆ChatGPT!谷歌这招太狠:连你的「阴阳怪气」都能神还原

完爆ChatGPT!谷歌这招太狠:连你的「阴阳怪气」都能神还原

谷歌发布Gemini 2.5 Flash原生音频模型,不仅能保留语调进行实时语音翻译,更让AI在复杂指令和连续对话中像真人一样自然流畅。这一更新标志着AI从简单的「文本转语音」跨越到了真正的「拟人化交互」时代。

来自主题: AI资讯
9089 点击    2025-12-15 11:36
干掉同传?谷歌把AI同传放入所有耳机,顺手发了个颠覆性的AI浏览器

干掉同传?谷歌把AI同传放入所有耳机,顺手发了个颠覆性的AI浏览器

干掉同传?谷歌把AI同传放入所有耳机,顺手发了个颠覆性的AI浏览器

Google 周五宣布,正式向 Google 翻译引入其 Gemini 模型的各项能力。此次更新不仅带来了能够通过耳机进行的实时语音翻译 Beta 版体验,还大幅提升了文本翻译的语境理解能力,并扩展了应用内的语言学习工具。

来自主题: AI资讯
9177 点击    2025-12-14 13:20
硅谷热议:最快语音转文字模型Scribe v2 Realtime

硅谷热议:最快语音转文字模型Scribe v2 Realtime

硅谷热议:最快语音转文字模型Scribe v2 Realtime

来自AI语音独角兽公司ElevenLabs,刚刚发布了Scribe v2 Realtime实时语音转文本模型,网友表示:Next-Level。150毫秒的超低延迟,93.5%的高准确率,还覆盖了90多种语言。

来自主题: AI资讯
7994 点击    2025-11-13 08:19
DeepSeek会说话了!只要2行代码,这家公司让任意大模型秒开口

DeepSeek会说话了!只要2行代码,这家公司让任意大模型秒开口

DeepSeek会说话了!只要2行代码,这家公司让任意大模型秒开口

在AI行业新诞生的「多模态交互」赛道上,声网发布的「对话式AI引擎」,让所有文本大模型秒变多模态,具备实时语音对话能力,补齐了大模型「失语」的短板。

来自主题: AI资讯
10091 点击    2025-02-26 14:46
腾讯混元悄悄开源3D大模型2.0,开源社区真的过年了。

腾讯混元悄悄开源3D大模型2.0,开源社区真的过年了。

腾讯混元悄悄开源3D大模型2.0,开源社区真的过年了。

早上MiniMax上线TTS,字节上线AI编程Trae;下午字节全量上线豆包实时语音;晚上DeepSeek开源R1性能直接对标OpenAI o1,然后Kimi的k1.5直接正面硬刚。昨天的余温还没过,今天下午,腾讯混元又悄悄开了个闭门发布会,作为混元的老基友,我自然是受邀参加期期不落。

来自主题: AI资讯
9252 点击    2025-01-21 22:41
OpenAI马拉松发布会Day9:不只有实时语音API,还发布了三个新模型+o1满血版API,同时大降价!

OpenAI马拉松发布会Day9:不只有实时语音API,还发布了三个新模型+o1满血版API,同时大降价!

OpenAI马拉松发布会Day9:不只有实时语音API,还发布了三个新模型+o1满血版API,同时大降价!

你是不是以为发了GPT4.5?但很抱歉,今天只是发布了o1的API以及实时语音的新玩意。 还记得前段时间的OpenAI的DevDay吗?那上面曾经说过会更新OpenAI的API,现在期货交割了!这次OpenAI表现很好,才用了短短的一个多月就完成了交割,值得鼓励!(我是在吹不下去了。。。) 

来自主题: AI资讯
9732 点击    2024-12-18 08:50