
OpenAI深夜发布3个全新的语音模型,一手实测都在这了。
OpenAI深夜发布3个全新的语音模型,一手实测都在这了。就在刚刚,OpenAI 宣布在其 API 中推出全新一代音频模型,包括语音转文本和文本转语音功能,让开发者能够轻松构建强大的语音 Agent。据 OpenAI 介绍,新推出的 gpt-4o-transcribe 采用多样化、高质量音频数据集进行了长时间的训练,能更好地捕获语音细微差别,减少误识别,大幅提升转录可靠性。
就在刚刚,OpenAI 宣布在其 API 中推出全新一代音频模型,包括语音转文本和文本转语音功能,让开发者能够轻松构建强大的语音 Agent。据 OpenAI 介绍,新推出的 gpt-4o-transcribe 采用多样化、高质量音频数据集进行了长时间的训练,能更好地捕获语音细微差别,减少误识别,大幅提升转录可靠性。
24年年底由Antropic提出并开源的MCP,如今已经成为AI编程及AI Agent领域热议的重要概念之一。截至发文前,Smithery已经收藏了 2211 个MCP Servers。需要注意的是,有些MCP可能不一定完全可用。
在去年的 Sequoia Capital AI Ascent 2024 上,红杉的几位合伙人在活动期间提出观点:“GenAI 在客服领域已经初步找到了 PMF”。时隔一年,在大模型落地的产品形态逐渐从单纯的 ChatBot 进化为 Agent 的当下,企业级 AI 客服将会有更多落地机会和想象空间。
「AI 届春晚」过去以来一直是 GTC 的外号之一,但在 GTC 2025 的开幕主题演讲中,这个梗被英伟达创始人、爱穿皮衣的老黄「偷了」。「我觉得 GTC 已经变成了 AI 界的超级碗」
Manus的火爆带热了多个技术概念,Computer Use Agent就是其中之一。但要探讨这种“电脑使用”智能体,还得从Claude 3.5 Sonnet说起。
25年开年以来,AI发展如火如荼,DeepSeek R1、OpenAI CUA、Manus等重要创新层出不穷,眼花缭乱。这里我将最近一个月以来的思考总结一下,对25年AI发展趋势做几点预判。
Salesforce 的CEO马克·贝尼奥夫上个月宣布 2025 年为“Agentforce 的绝对之年”,这是这家软件公司去年秋天推出的一款产品,旨在帮助客户实现客户服务和其他业务功能的自动化。
40%的企业反馈表明,目前对采用RPA结合AI技术持积极态度
角色扮演 AI(Role-Playing Language Agents,RPLAs)作为大语言模型(LLM)的重要应用,近年来获得了广泛关注。
最近一段时间,智能体(Agent)再次成为 AI 领域热议的焦点。