AI资讯新闻榜单内容搜索-GPT-5

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: GPT-5
GPT-5编程测评大反转!表面不及格,实际63.1%的任务没交卷,全算上成绩比Claude高一倍

GPT-5编程测评大反转!表面不及格,实际63.1%的任务没交卷,全算上成绩比Claude高一倍

GPT-5编程测评大反转!表面不及格,实际63.1%的任务没交卷,全算上成绩比Claude高一倍

Scale AI的新软件工程基准SWE-BENCH PRO,出现反转!表面上看,“御三家”集体翻车,没一家的解决率超过25%: GPT-5、Claude Opus 4.1、Gemini 2.5分别以23.3%、22.7%、13.5%的解决率“荣”登前三。

来自主题: AI技术研报
8816 点击    2025-09-22 16:11
马斯克Grok 4 Fast首发霸榜!2.5倍速秒杀GPT-5,成本暴降98%直追Gemini

马斯克Grok 4 Fast首发霸榜!2.5倍速秒杀GPT-5,成本暴降98%直追Gemini

马斯克Grok 4 Fast首发霸榜!2.5倍速秒杀GPT-5,成本暴降98%直追Gemini

xAI重磅推出Grok 4 Fast,创新融合推理与非推理双模式,支持200万token上下文。在NYT Connections基准和AA智能指数中表现卓越,超越多家顶级模型,标志着AI智能获取门槛的进一步降低。

来自主题: AI资讯
7685 点击    2025-09-21 11:15
阿里新开源提出建设性安全对齐方案,向“让用AI的人安全”新范式跃迁

阿里新开源提出建设性安全对齐方案,向“让用AI的人安全”新范式跃迁

阿里新开源提出建设性安全对齐方案,向“让用AI的人安全”新范式跃迁

阿里巴巴集团安全部联合清华大学、复旦大学、东南大学、新加坡南洋理工等高校,联合发布技术报告;其理念与最近OpenAI发布的GPT-5 System Card放在首位的“From Hard Refusals to Safe-Completions”理念不谋而合。

来自主题: AI技术研报
5849 点击    2025-09-21 11:09
奥特曼爆料:GPT-5重构一切!一人顶五个团队

奥特曼爆料:GPT-5重构一切!一人顶五个团队

奥特曼爆料:GPT-5重构一切!一人顶五个团队

GPT‑5来了,让AI第一次像「随身博士」——不只答题,更能协同完成多步骤任务。奥特曼在最新对谈中给出一份可执行的未来清单:年轻人要学什么、创业护城河怎么建、内容过载时代为何「真实人」更稀缺……

来自主题: AI资讯
6159 点击    2025-09-21 10:44
ICPC总决赛被AI统治!GPT-5组合系统12题全对登顶,人类打破头只能争夺第三

ICPC总决赛被AI统治!GPT-5组合系统12题全对登顶,人类打破头只能争夺第三

ICPC总决赛被AI统治!GPT-5组合系统12题全对登顶,人类打破头只能争夺第三

在刚刚结束的2025年国际大学程序设计竞赛(ICPC)世界总决赛上,OpenAI的系统完美解决全部12道题目,若计入排名将位居第一。谷歌的Gemini 2.5 Deep Think模型解决10道题目,达到金牌水准名列第二。

来自主题: AI资讯
7000 点击    2025-09-19 09:24
GPT-5攻入数学圈,证明定理快过博士生?网友热议AI新角色

GPT-5攻入数学圈,证明定理快过博士生?网友热议AI新角色

GPT-5攻入数学圈,证明定理快过博士生?网友热议AI新角色

当GPT-5第一次被写进数学论文,舆论瞬间炸开。有人惊呼「AI 数学家诞生」,有人却冷静提醒:它只是把熟悉的工具快速拼接。于是,一个新的问题被摆到台前:这究竟是科研的加速器,还是博士培养的绊脚石?

来自主题: AI技术研报
6990 点击    2025-09-18 15:41
ChatGPT负责人深度复盘,爆4o复活内幕!过快下线是失误,将迭代模型人格

ChatGPT负责人深度复盘,爆4o复活内幕!过快下线是失误,将迭代模型人格

ChatGPT负责人深度复盘,爆4o复活内幕!过快下线是失误,将迭代模型人格

GPT-5上线引发全网吐槽。8月14日,ChatGPT负责人Nick Turley深度复盘了GPT-5发布「风波」,并详细总结了此次产品发布中的失误:比如过快下线GPT-4o、低估用户会对模型的情感依恋、没有让用户建立起「可预期性」等。Nick也分享了OpenAI的产品设计哲学,要坚持「真正对用户有帮助」的原则。

来自主题: AI资讯
5596 点击    2025-09-18 15:34
7 小时连续重构不掉线!一骑绝尘的Claude 终于遇到对手:Greg Brockman亲自解读AI编程重大突破

7 小时连续重构不掉线!一骑绝尘的Claude 终于遇到对手:Greg Brockman亲自解读AI编程重大突破

7 小时连续重构不掉线!一骑绝尘的Claude 终于遇到对手:Greg Brockman亲自解读AI编程重大突破

9 月 16 日,OpenAI 正式推出一款新模型 GPT-5-Codex ,这是一个经过微调的 GPT-5 变体,专门为其各种 AI 辅助编程工具而设计。该公司表示,新模型 GPT-5-Codex 的“思考”时间比之前的模型更加动态,完成一项编码任务所需的时间从几秒到七个小时不等。因此,它在代理编码基准测试中表现更佳。

来自主题: AI技术研报
6524 点击    2025-09-18 15:19
喝点VC|红杉美国解读GPT-5后AI产业版图新格局:全新的AI交互范式产生,AI时代的加速发展拐点已到

喝点VC|红杉美国解读GPT-5后AI产业版图新格局:全新的AI交互范式产生,AI时代的加速发展拐点已到

喝点VC|红杉美国解读GPT-5后AI产业版图新格局:全新的AI交互范式产生,AI时代的加速发展拐点已到

经过数月的外界猜测,CEO Sam Altman揭晓了一款远超预期的全新模型。用他的话来说,与前代的跃升可以这样形容——“GPT-4像是在和一位大学生对话,而GPT-5则是第一次让人真切地感觉在与一位博士级专家交流。”

来自主题: AI资讯
7854 点击    2025-09-18 15:10