
全球第一再升级!MiniMax Speech 2.5上线:多语种表现力更强,音色复刻更“像”
全球第一再升级!MiniMax Speech 2.5上线:多语种表现力更强,音色复刻更“像”今天,MiniMax发布新一代语音生成模型Speech 2.5,再次刷新全球最强语音模型的上限。
今天,MiniMax发布新一代语音生成模型Speech 2.5,再次刷新全球最强语音模型的上限。
对大公司来说,钱不值钱,最值钱的是时间。本期播客,我们邀请在硅谷专注 AI 企业级应用、医疗和工业自动化早期投资的风险投资机构 Fusion Fund 创始合伙人张璐,梳理上半年硅谷的科技大事件,以及从 Windsurf 收购案入手,分析这件事折射出了硅谷的初创生态在发生的变化,以及从 Meta 到 Google、再到苹果、亚马逊、微软,上半年的一些关键动作意味着哪些战略选择。
一句话概括,花大价钱请来的AI智能体天天搁那儿“过度思考”,这篇论文教你如何让它“该省省该花花”,别再当冤大头了,当你给智能体卸掉复杂记忆/冗余规划这些"奢侈品"后,发现它跑得比香港记者还快还便宜。
近日,百川AI助诊仪在海淀区多个社区卫生服务中心上岗"执业",“AI+真人”的双医模式累计服务7743人次,海淀居民感受到了高水平AI医生带来的体验冲击。 北京市海淀区人民政府副区长林航介绍:依托“海淀健康”小程序上线AI医生助手,可辅助诊断3000多种常见疾病,有效提升了家庭医生的服务质量和效率。
GPT5更新了,简单测了几个Case。GPT5更新了,简单测了几个Case。山姆真的是营销大师。从前些天透漏的信息看,GPT5 牛逼的不行了。但实际呢?!至少在我今天的测试Case中,没一个比 Claude 4 sonnet 好!
英国职场心理健康初创公司Unmind近日完成了C轮融资,筹集资金达3060万欧元。这笔资金将用于进一步扩展其基于人工智能的心理健康支持平台,以帮助全球员工提升心理健康水平。
朋友,你只需输入下方的提示词。 给孩子解释下他是怎么来的,用宫崎骏的风格输出 一个儿童绘本就造好了。 有封面,能定制配图风格,有暖心的小故事。 甚至只花了不到 1 分钟。
当老年大学还在“唱歌跳舞”,AI 教练已用“彩虹夸夸术”,点亮1800万会员的新生活。
近一年来,围绕人工智能(AI)、生成式 AI(GenAI)和大语言模型(LLM)的炒作愈演愈烈,大众的兴趣翻了一番,针对 AI 的投资激增,各国政府也采取了更加明确的立场。根据一些人的说法,AI 与人类的未来息息相关。
人工智能引领第四次科技革命,是当前最火的、最具前景、最具爆发力的科技赛道。进入到2025年,发生了什么新的变化?中国人工智能正告别“百模大战”的规模竞赛,向以DeepSeek等六小虎为代表的头部大模型集中。AI发展的核心,从追求模型“可用”转向实现场景的“好用”。
昨天是个热闹的日子,OpenAI 和 Anthropic 几乎在同一时间发布了自家的新款模型:前者是自 GPT-2 以来重新开源的两款模型 gpt-oss(120b 和 20b),后者是 Claude 系列最强的 Opus 4.1。
大量工作在争夺用户注意力上,不少不错的细节提升,但没有大的惊喜,甚至一度有些好笑,“AGI”还早,肉搏时代开启了。
只靠说话和AI眼镜互动,确实有点不方便。现在新玩法来了!数字替身帮你“隔空抓物”,混合现实即时选择现实世界的物体作为上下文。
AI学会像人一样修Bug了!“这个Bug我上周刚修过”“这个报错怎么又来了”“新人怎么又在同一个地方踩坑”……
过去三十年,互联网经历了从静态网页到智能推荐的深刻演变。如今,我们正站在互联网的另一个重大转折点上。 这一转折,来自一种全新的范式设想 —— Agentic Web,一个由 AI 智能体组成的、目标导向型的互联网系统。在这个新框架中,用户不再手动浏览网页、点击按钮,而是通过自然语言向智能体发出一个目标,AI 会自主规划、搜索、调用服务、协调其他智能体,最终完成复杂任务。
我非常不理解为什么有AI创业者选择播客赛道。 音频播客是一个非常小众的市场。小宇宙日活只有几百万,基本只有一线城市白领收听。就算是海外市场,Spotify都不能靠播客盈利,播客只会拖累其利润。 AI播客更是一个纯粹的、非常伪的伪命题。
自首次提出 GPT 架构以来,转眼已经过去了七年。 如果从 2019 年的 GPT-2 出发,回顾至 2024–2025 年的 DeepSeek-V3 和 LLaMA 4,不难发现一个有趣的现象:尽管模型能力不断提升,但其整体架构在这七年中保持了高度一致。
心理健康问题影响着全球数亿人的生活,然而患者往往面临着双重负担:不仅要承受疾病本身的痛苦,还要忍受来自社会的偏见和歧视。世界卫生组织数据显示,全球有相当比例的心理健康患者因为恐惧社会歧视而延迟或拒绝治疗。
2023年,当整个AI行业都在为“最强大模型”争得头破血流时,亚马逊云科技却洞察到一个关键事实:AI的价值不在于谁的模型最强大,而在于能否为不同场景选择最适合的模型。
全网疯玩Genie3,惊叹:这才是真正的大世界!距离上一代Genie2,才刚刚过去7个多月,谷歌世界模型就像开了倍速进化
众所周知,大型语言模型的训练通常分为两个阶段。第一阶段是「预训练」,开发者利用大规模文本数据集训练模型,让它学会预测句子中的下一个词。第二阶段是「后训练」,旨在教会模型如何更好地理解和执行人类指令。
强化学习(RL)范式虽然显著提升了大语言模型(LLM)在复杂任务中的表现,但其在实际应用中仍面临传统RL框架下固有的探索难题。
在人工智能技术浪潮的席卷下,AI在编程领域的应用正以令人目眩的速度演进,深刻改变着软件开发行业的固有格局。
强化学习+任意一张牌,往往就是王炸。专注于LLM+RL的科技公司OpenPipe提出全新开源强化学习框架——MCP·RL。
Tavily,一家为AI提供企业级安全搜索API的初创公司,于近日完成2000万美元的A轮融资,由Insight Partners领投,公司累计融资额达2500万美元。Tavily源自其创始人在2023年创建的、在GitHub上广受欢迎的开源项目GPT Researcher,专注于解决AI智能体在访问互联网时面临的合规与安全挑战。
近日,一项由北京大学、字节跳动 Seed 团队及香港大学联合进行的研究,提出了一种名为「SWE-Swiss」的完整「配方」,旨在高效训练用于解决软件工程问题的 AI 模型。研究团队推出的 32B 参数模型 SWE-Swiss-32B,在权威基准 SWE-bench Verified 上取得了 60.2% 的准确率,在同尺寸级别中达到了新的 SOTA。
近日,麻省理工学院也推出了一个AI学习平台。这个名叫MIT Learn的平台提供超过12700个学习资源,其中大部分是免费的。这个名叫MIT Learn的平台提供超过12700个学习资源,其中大部分是免费的。
凌晨1点,在万众瞩目的境况下,OpenAI的直播正式开始。GPT-5,终于来了。
一个半小时之前,Ghat GPT 5,千呼万唤始出来,然后端了许多公司。刚刚研读了 GPT5 完整技术文档,先分享一下技术细节。刚刚研读了 GPT5 完整技术文档,先分享一下技术细节。
2025年7月,X(原推特)的首页被一个金色双马尾、身着黑色露肩连衣裙和渔网黑丝的二次元少女刷屏了。关于她的帖子浏览量动辄达到几十万甚至上百万。这里面有着各种画风和姿势的二创图: