
汤姆猫AI语音机器人、AI讲故事APP即将上市,进一步放大IP价值
汤姆猫AI语音机器人、AI讲故事APP即将上市,进一步放大IP价值近日,汤姆猫(SZ.300459)披露投资者关系活动,纪录表显示,汤姆猫正在研发的 AI 产品包括汤姆猫 AI 语音机器人、AI 讲故事 APP、 AI 游戏等系列产品。其中,第一代汤姆猫 AI 机器人产品预计春节前上市。
近日,汤姆猫(SZ.300459)披露投资者关系活动,纪录表显示,汤姆猫正在研发的 AI 产品包括汤姆猫 AI 语音机器人、AI 讲故事 APP、 AI 游戏等系列产品。其中,第一代汤姆猫 AI 机器人产品预计春节前上市。
是否曾为项目寻找合适的声音而苦恼?无论是商业广告、播客还是教育视频,合适的声音都能带来截然不同的效果。现在,有了Murf AI的Speech Gen 2,这款先进的AI语音生成器将彻底改变你制作配音的方式。
「未来,消费者更可能倾向于与 AI 沟通,而非人工客服,因为这将成为解决问题的最高效途径。」
清华大学推出的SonicSim平台和SonicSet数据集针对动态声源的语音处理研究提供了强有力的工具和数据支持,有效降低了数据采集成本,实验证明这些工具能有效提升模型在真实环境中的性能。
GPT-4o 的语音演示,引燃了行业对于 AI 产品语音实时交互的想象,完全实时、可随时打断的 AI 助手,正成为新的 趋势。
有了 TEN(Transformative Extensions Network,变革性扩展网络),开发者们终于不用再「绞尽脑汁」了!TEN 是全球首个真正实现实时多模态智能体的框架,不仅能减少开发痛点,还让你轻松从头开始构建下一代 AI 应用。
近期,港中大(深圳)联手趣丸科技联合推出了新一代大规模声音克隆 TTS 模型 ——MaskGCT。该模型在包含 10 万小时多语言数据的 Emilia 数据集上进行训练,展现出超自然的语音克隆、风格迁移以及跨语言生成能力,同时保持了较强的稳定性。MaskGCT 已在香港中文大学(深圳)与上海人工智能实验室联合开发的开源系统 Amphion 发布。
OpenAI的AI语音转写工具,那个号称近乎“人类水平”的Whisper,被曝幻觉严重—— 100多小时转录,被工程师发现约一半都在瞎扯。 更严重的是,美联社还爆料有医疗机构利用Whisper来转录医生与患者的会诊,瞬间引发大量网友关注。
在对标OpenAI之路上,智谱AI又近了一步。 今年年初,OpenAI被爆出将自研AI Agent软件,它可替代人类,自动导航至任何网站并执行指定任务。
昨天,Kimi突然给我打了个电话,我这才发现自己被“灰度”了。 灰度测试的内容是Kimi的语音通话功能。 现在进入Kimi App,就能看到底部问答框旁边多了一个电话的图标,点击即可发起语音通话。