刚刚,OpenAI发布GPT-5-Codex:可独立工作超7小时,还能审查、重构大型项目
刚刚,OpenAI发布GPT-5-Codex:可独立工作超7小时,还能审查、重构大型项目凌晨 1 点,OpenAI 发布了 GPT-5-Codex。
凌晨 1 点,OpenAI 发布了 GPT-5-Codex。
关注 AI 行业的朋友都知道,今年上半年 MCP 火得离谱。现在热度稍微降了一些,但已经有一些产品靠 MCP 开始赚钱了。
智东西9月15日报道,今天,阿里巴巴通义实验室推出了FunAudio-ASR端到端语音识别大模型。这款模型通过创新的Context模块,针对性优化了“幻觉”、“串语种”等关键问题,在高噪声的场景下,幻觉率从78.5%下降至10.7%,下降幅度接近70%。
让数字人的口型随着声音一开一合早已不是新鲜事。更令人期待的,是当明快的旋律响起,它会自然扬起嘴角,眼神含笑;当进入说唱段落,它会随着鼓点起伏,肩膀与手臂有节奏地带动气氛。
如果要评选出 2025 年暑期乃至 25 全年最受欢迎的 Agent 项目,Aivilization 毫无疑问会获奖。
氛围编程,正批量制造「AI保姆」。一位15年资深开发者,为赶工用AI编程,结果bug成山不得不推翻重来,痛哭半小时。如今,一种全新职业「氛围编程清理专家」冲上了热榜。
生成式AI的快与好,终于能兼得了?
你有没有想过,为什么我们每天与 ChatGPT 或其他 AI 助手聊天时,从来没有看到过广告?这并不是因为这些公司不想赚钱,而是因为没有人真正搞清楚如何在 AI 对话中优雅地植入广告。
日前,在 2025 Inclusion・外滩大会上,蚂蚁集团发布了全球首个智能眼镜可信连接技术框架 ——gPass。该技术具备「安全、交互、连接」三大核心能力,致力于实现 AI 眼镜与智能体之间安全、可信、即时信息交互,为用户打造自然无感的服务体验,同时构建起面向眼镜厂商和开发者的安全 AI 数字服务生态。
随着Agent的爆发,大型语言模型(LLM)的应用不再局限于生成日常对话,而是越来越多地被要求输出像JSON或XML这样的结构化数据。这种结构化输出对于确保安全性、与其他软件系统互操作以及执行下游自动化任务至关重要。