AI资讯新闻榜单内容搜索-实时语音模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 实时语音模型
谷歌掀语音Agent新纪元!开口就是生产力,Siri的最强外挂来了?

谷歌掀语音Agent新纪元!开口就是生产力,Siri的最强外挂来了?

谷歌掀语音Agent新纪元!开口就是生产力,Siri的最强外挂来了?

昨日凌晨,谷歌正式推出其最高质量的音频和语音模型——实时语音模型Gemini 3.1 Flash Live,并在Gemini App、Search Live以及Google AI Studio中同步开放,其中后者以预览版本向开发者提供。

来自主题: AI资讯
10202 点击    2026-03-27 14:41
百万围观、HuggingFace多模态登顶,华人团队FlashLabs开源语音模型Chroma 1.0

百万围观、HuggingFace多模态登顶,华人团队FlashLabs开源语音模型Chroma 1.0

百万围观、HuggingFace多模态登顶,华人团队FlashLabs开源语音模型Chroma 1.0

近期,FlashLabs 发布并开源了其实时语音模型 Chroma 1.0,其定位为全球首个开源的端到端语音到语音模型。Chroma 1.0 发布之后,便在社媒爆火,吸引了大量的关注。X 上的官推帖子已经突破了百万浏览量。

来自主题: AI资讯
9002 点击    2026-01-23 16:25
开源版GPT-4o来了,AI大神Karpathy盛赞!67页技术报告全公开

开源版GPT-4o来了,AI大神Karpathy盛赞!67页技术报告全公开

开源版GPT-4o来了,AI大神Karpathy盛赞!67页技术报告全公开

两个多月前那个对标GPT-4o的端到端语音模型,终于开源了。大神Karpathy体验之后表示:nice!

来自主题: AI技术研报
7162 点击    2024-09-24 12:07