AI资讯新闻榜单内容搜索-STT

硅谷热议：最快语音转文字模型Scribe v2 Realtime

来自AI语音独角兽公司ElevenLabs，刚刚发布了Scribe v2 Realtime实时语音转文本模型，网友表示：Next-Level。150毫秒的超低延迟，93.5%的高准确率，还覆盖了90多种语言。

来自主题: AI资讯

9263 点击 2025-11-13 08:19

上篇文章和大家聊了自研的多维表格编辑器pxcharts。今天和大家继续分享一款我最近发现的宝藏AI工具——AI-Media2Doc。

来自主题: AI资讯

10011 点击 2025-07-29 11:16

vivo自研大模型用的数据筛选方法，公开了。

来自主题: AI技术研报

11321 点击 2025-05-15 14:11

OpenAI的实时API支持低延迟、双向音频流，使得多模态AI应用（如语音对话Agent）得以实现。它通过WebSocket连接管理对话状态，并提供短语结束检测和语音活动检测（VAD）功能，大大简化了实时语音应用的开发。

来自主题: AI资讯

10960 点击 2024-12-13 17:05

AI Chat把大模型变成人类想象力的引擎。就像电影《Her》表现的那样，主人公可以和逝世多年的Alan Wstts的虚拟AI在线聊天。

来自主题: AI资讯

5313 点击 2023-12-30 16:03