AI资讯新闻榜单内容搜索-实时语音

豆包全量上线超拟人的「实时语音」，这就是中文的语音之王。

就在刚刚，豆包的超级实时语音全量上线了。

来自主题: AI资讯

11237 点击 2025-01-20 21:29

OpenAI Realtime API 的「说明书」。

来自主题: AI技术研报

3813 点击 2025-01-11 14:29

今天，「天工大模型4.0」o1版/4o版在网页端和APP端正式上线了，人人可玩的那种。

来自主题: AI资讯

9800 点击 2025-01-06 15:54

家人们！OpenAI 这 12 天的连续剧大家都追完了吗？别急着下线！

来自主题: AI资讯

7546 点击 2024-12-25 11:39

你是不是以为发了GPT4.5？但很抱歉，今天只是发布了o1的API以及实时语音的新玩意。　还记得前段时间的OpenAI的DevDay吗？那上面曾经说过会更新OpenAI的API，现在期货交割了！这次OpenAI表现很好，才用了短短的一个多月就完成了交割，值得鼓励！（我是在吹不下去了。。。）　

来自主题: AI资讯

10711 点击 2024-12-18 08:50

今天是美国的周一，本来以为会跟上周一样，挑选周一发个大货，毕竟上周就有爱好探索的网友发现 GPT4o 好像有了更新，已经开始说自己是 GPT4.5 了。　

来自主题: AI资讯

9874 点击 2024-12-17 10:58

“它前进着，又跨过了新的一级台阶，耳边仿佛传来由远及近的低语：前方，即是世界。”

来自主题: AI资讯

10092 点击 2024-12-16 10:19

OpenAI的实时API支持低延迟、双向音频流，使得多模态AI应用（如语音对话Agent）得以实现。它通过WebSocket连接管理对话状态，并提供短语结束检测和语音活动检测（VAD）功能，大大简化了实时语音应用的开发。

来自主题: AI资讯

10968 点击 2024-12-13 17:05

算起来，距离 5 月 14 日 OpenAI 发布 GPT-4o 高级语音模式已经过去了半年时间。在这期间，AI 实时语音对话已经成为了有能力大厂秀肌肉、拼实力的新战场。

来自主题: AI资讯

8051 点击 2024-11-20 15:01

Ichigo[1] 是一个开放的、持续进行的研究项目，目标是将基于文本的大型语言模型（LLM）扩展，使其具备原生的“听力”能力。

来自主题: AI资讯

7254 点击 2024-11-06 10:00