
今夜,语音模型第一次超越人类!OpenAI再现Her时刻,95后华人研究员坐镇
今夜,语音模型第一次超越人类!OpenAI再现Her时刻,95后华人研究员坐镇OpenAI凌晨发布最新生产级别语音模型和API。Realtime API实现语音直接处理,支持图像输入、远程MCP服务器与SIP打电话,极大简化语音智能体构建;而新一代语音到语音模型gpt-realtime,在音质、理解力、指令遵循和函数调用上全面提升,语音几乎媲美真人,还能多语种切换与细腻表达。
OpenAI凌晨发布最新生产级别语音模型和API。Realtime API实现语音直接处理,支持图像输入、远程MCP服务器与SIP打电话,极大简化语音智能体构建;而新一代语音到语音模型gpt-realtime,在音质、理解力、指令遵循和函数调用上全面提升,语音几乎媲美真人,还能多语种切换与细腻表达。
小扎AI豪赌,要翻车了?MSL成立两月,从PyTorch元老到新招募的硅谷天才,至少八人曝出离职。甚至,还有不少直奔OpenAI。内部重组频繁,战略摇摆不定,Meta超级智能梦裂痕满满。
罕见,着实是太罕见。 一觉醒来,AI圈的两大顶流——OpenAI和Anthropic,竟然破天荒地联手合作了。
OpenAI的重组悬而未决,核心在控制权与确定性:多云是否松口、微软能否获取训练细节、以及最关键的AGI条款的去留。这三件事,决定了微软最终30%–35%的持股价值,也决定了软银100亿美元的到账节奏与估值锚点。
小扎挖人如探囊取物,留人却像竹篮打水。 随着这场AI人才争夺战进入白热化,大模型公司员工们的薪酬差距也在不断扩大。
本文介绍了来自北京大学王选计算机研究所王勇涛团队及合作者的最新研究成果 AutoOcc。针对开放自动驾驶场景,该篇工作提出了一个高效、高质量的 Open-ended 三维语义占据栅格真值标注框架,无需任何人类标注即可超越现有语义占据栅格自动化标注和预测管线,并展现优秀的通用性和泛化能力,论文已被 ICCV 2025 录用为 Highlight。
刚刚,马斯克xAI加入Coding战局:推出智能编程模型Grok Code Fast 1。Fast写进名字里,新模型主打的就是快速、经济,且支持256K上下文,可在GitHub Copilot、Cursor、Cline、Kilo Code、Roo Code、opencode和Windsurf上使用,还限时7天免费!
OpenAI和Anthropic罕见合作!因为AI安全「分手」后,这次双方却因为安全合作:测试双方模型在幻觉等四大安全方面的具体表现。这场合作,不仅是技术碰撞,更是AI安全的里程碑,百万用户每天的互动,正推动安全边界不断扩展。
顶尖AI人才的争夺战在Meta和OpenAI等科技巨头之间越演越烈,但根据华尔街日报的报导: Claude的开发商Anthropic,似乎才是众多工程师更心仪的去处。
小扎钞能力失效,一夜痛失三位核心研究员!其中,两位前OpenAI大牛仅入职一月,火速回流OpenAI。团队频繁重组,内部矛盾「埋雷」,小扎「超级智能梦」能否交出一份满意的答卷?