AI资讯新闻榜单内容搜索-AI语音

通义实验室大火的 WebAgent 续作：全开源模型方案超过GPT4.1 , 收获开源SOTA

WebAgent 续作《WebShaper: Agentically Data Synthesizing via Information-Seeking Formalization》中

来自主题: AI资讯

8153 点击 2025-07-30 11:26

豆包上新同声传译，顺便狙击阿里AI眼镜？

AI语音成大厂必争之地打开字节、阿里们的多模态能力地图，每块宝藏都标着"语音”。

来自主题: AI资讯

9727 点击 2025-07-28 10:23

Mistral发布首款开源AI音频模型Voxtral

随着 AI 系统越来越强大，人们与机器的交流方式也在发生变化。语音，正在迅速成为默认的交互入口。

来自主题: AI资讯

9416 点击 2025-07-16 16:32

完全透明开源的共情语音大模型，三阶段训练，四大模块实现端到端对话 | 紫东太初联合长城汽车开源OpenS2S

GPT-4o、Gemini这些顶级语音模型虽然展现了惊人的共情对话能力，但它们的技术体系完全闭源。

来自主题: AI技术研报

9802 点击 2025-07-16 16:30

1年15倍增长，硅谷顶级VC投资2000万美金，这家来自欧洲的公司如何在拥挤的AI语音客服赛道杀出重围

你有没有想过，为什么打客服电话时还要按那么多数字键？为什么不能像跟真人对话一样，直接说出你的需求？这个困扰无数消费者的问题，正在被一家来自柏林的创业公司彻底解决。Synthflow AI 刚刚完成了 2000 万美元的 A 轮融资，由 Accel 领投，而他们的目标是让每一通客服电话都变成自然流畅的对话体验。

来自主题: AI资讯

9062 点击 2025-07-06 16:14

AI 语音爆发的这半年，一位「局中人」看到的赛道爆发逻辑

苹果 Siri 折戟，但越来越多的「AI Siri」拿到了融资。

来自主题: AI资讯

9532 点击 2025-07-04 11:07

对话Wispr Flow 创始人 Tanay：语音输入，如何创造极致的 Voice AI 产品体验

如果说硅谷最近有什么产品能真正给大家带来那种珍贵的 aha moment，语音输入产品 Wispr Flow 就是其中之一。

来自主题: AI资讯

11699 点击 2025-07-03 11:34

德国AI语音助手初创公司 Synthflow AI 获2000万美元融资

杜塞尔多夫讯，AI初创企业Synthflow近日完成2000万美元（约合人民币1.45亿元）融资。此次A轮融资由美国投资机构安克创投（Accel）领投，该机构曾投资支付平台Klarna、流媒体Spotify及流程优化软件Celonis。现有投资方Atlantic Labs和Singular也参与本轮注资。《商报》独家获悉此消息。

来自主题: AI资讯

10470 点击 2025-06-28 13:20

做语音识别现在还能融3000万美金？海外顶级VC押注AI-Native的语音交互，下一个操作系统级的机会！

你有没有想过，我们每天敲击键盘的这个动作，可能很快就会变成历史？150 年前发明的键盘，竟然仍然是我们与计算机交流的主要方式。

来自主题: AI资讯

8385 点击 2025-06-27 10:36

AI语音的可能性，被彻底打开了

ElevenLabs 这家 AI 音频公司最近开始发力了。早上，看到他们的一条视频，我觉得 AI 语音的可能性现在被充分打开

来自主题: AI资讯

10742 点击 2025-06-25 10:38

AI资讯新闻榜单内容搜索-AI语音

通义实验室大火的 WebAgent 续作：全开源模型方案超过GPT4.1 , 收获开源SOTA

豆包上新同声传译，顺便狙击阿里AI眼镜？

Mistral发布首款开源AI音频模型Voxtral​

完全透明开源的共情语音大模型，三阶段训练，四大模块实现端到端对话 | 紫东太初联合长城汽车开源OpenS2S

1年15倍增长，硅谷顶级VC投资2000万美金，这家来自欧洲的公司如何在拥挤的AI语音客服赛道杀出重围

AI 语音爆发的这半年，一位「局中人」看到的赛道爆发逻辑

对话Wispr Flow 创始人 Tanay：语音输入，如何创造极致的 Voice AI 产品体验

德国AI语音助手初创公司 Synthflow AI 获2000万美元融资

做语音识别现在还能融3000万美金？海外顶级VC押注AI-Native的语音交互，下一个操作系统级的机会！

AI语音的可能性，被彻底打开了

Mistral发布首款开源AI音频模型Voxtral