AI资讯新闻榜单内容搜索-AI语音

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: AI语音
硅谷热议:最快语音转文字模型Scribe v2 Realtime

硅谷热议:最快语音转文字模型Scribe v2 Realtime

硅谷热议:最快语音转文字模型Scribe v2 Realtime

来自AI语音独角兽公司ElevenLabs,刚刚发布了Scribe v2 Realtime实时语音转文本模型,网友表示:Next-Level。150毫秒的超低延迟,93.5%的高准确率,还覆盖了90多种语言。

来自主题: AI资讯
7379 点击    2025-11-13 08:19
翻译界的ChatGPT时刻!Meta发布新模型,几段示例学会冷门新语言

翻译界的ChatGPT时刻!Meta发布新模型,几段示例学会冷门新语言

翻译界的ChatGPT时刻!Meta发布新模型,几段示例学会冷门新语言

在7000多种人类语言中,只有少数被现代语音技术听见,如今这种不平等或将被打破。Meta发布的Omnilingual ASR系统能识别1600多种语言,并可通过少量示例快速学会新语言。以开源与社区共创为核心,这项技术让每一种声音都有机会登上AI的舞台。

来自主题: AI资讯
7815 点击    2025-11-12 08:38
OpenAI引爆新赛道:AI不再卖技术,而是卖「活人感」!

OpenAI引爆新赛道:AI不再卖技术,而是卖「活人感」!

OpenAI引爆新赛道:AI不再卖技术,而是卖「活人感」!

一段令人心碎的离别视频走红:小女孩与AI玩具的深情告别,揭示了对话式AI如何悄然融入人类情感世界,预示着实时交互技术的革命性突破。

来自主题: AI资讯
7722 点击    2025-11-10 15:12
黄仁勋投了家复刻马斯克声音的AI公司

黄仁勋投了家复刻马斯克声音的AI公司

黄仁勋投了家复刻马斯克声音的AI公司

如果我不说,你能分清哪个是马斯克本人的声音吗?

来自主题: AI资讯
8781 点击    2025-11-03 14:51
让 AI 开口「像人」:最难的不是智能,是「嗓音」

让 AI 开口「像人」:最难的不是智能,是「嗓音」

让 AI 开口「像人」:最难的不是智能,是「嗓音」

Voice Agent 赛道正在爆发,但它迫切需要一个能让对话真正「流动起来」的底层引擎,一个能撑起下一代交互体验的 TTS 模型。竞争的焦点,已经从 LLM 的「大脑」,延伸到了 TTS 的「嗓音」。谁掌握嗓音,谁就掌握着下一代 AI 商业化的钥匙。而 10 月 30 日 MiniMax 发布的 Speech 2.6 模型,似乎正是一个专为解决这些痛点而来的答案。

来自主题: AI资讯
7816 点击    2025-10-31 15:35
语音助手的「智商滑铁卢」:当GPT开口说话,准确率从74.8%跌到6.1%

语音助手的「智商滑铁卢」:当GPT开口说话,准确率从74.8%跌到6.1%

语音助手的「智商滑铁卢」:当GPT开口说话,准确率从74.8%跌到6.1%

杜克大学和 Adobe 最近发布的 VERA 研究,首次系统性地测量了语音模态对推理能力的影响。研究覆盖 12 个主流语音系统,使用了 2,931 道专门设计的测试题。

来自主题: AI技术研报
6637 点击    2025-10-18 12:08
速递|AI语音革新市场调研:Keplar获凯鹏华盈领投340万美元种子轮

速递|AI语音革新市场调研:Keplar获凯鹏华盈领投340万美元种子轮

速递|AI语音革新市场调研:Keplar获凯鹏华盈领投340万美元种子轮

Keplar 是一家市场调研初创公司,该公司运用语音 AI 技术进行客户访谈,能以远低于传统调研咨询公司的成本,为客户提供更快速的分析报告。

来自主题: AI资讯
6104 点击    2025-09-23 15:02
靠给用户念书,AI语音产品移动端月入千万

靠给用户念书,AI语音产品移动端月入千万

靠给用户念书,AI语音产品移动端月入千万

两年过去,ElevenLabs 已经融资 2.6 亿美元,网站访问量超 2500 万,稳坐 AI Web 全球 Top50 榜单,成为 AI 语音赛道的头部创企。而 Speechify 却渐渐“掉队”,榜单中难觅身影,而作为一个 AI 企业,它仅在 2017 和 2020 年有过两次融资,近几年也没有传出任何融资消息。

来自主题: AI资讯
8746 点击    2025-09-17 09:40
刚刚!阿里发新模型,幻觉率爆降70%

刚刚!阿里发新模型,幻觉率爆降70%

刚刚!阿里发新模型,幻觉率爆降70%

智东西9月15日报道,今天,阿里巴巴通义实验室推出了FunAudio-ASR端到端语音识别大模型。这款模型通过创新的Context模块,针对性优化了“幻觉”、“串语种”等关键问题,在高噪声的场景下,幻觉率从78.5%下降至10.7%,下降幅度接近70%。

来自主题: AI技术研报
8182 点击    2025-09-16 11:23
安卓AI语音快捷指令革命:SFA打破操作边界,智能交互未来已来

安卓AI语音快捷指令革命:SFA打破操作边界,智能交互未来已来

安卓AI语音快捷指令革命:SFA打破操作边界,智能交互未来已来

一句语音指令,复杂操作自动完成。安卓正迎来一场由AI语音快捷指令主导的交互革命,Shortcuts for Android (SFA) 不仅填补了与iOS快捷指令的差距,更正在重新定义人们与移动设备的互动方式。

来自主题: AI资讯
9057 点击    2025-09-14 11:37