AI资讯新闻榜单内容搜索-gpt

这套题，GPT-5.5、Opus 4.7加起来没考到「1分」，人类却拿了满分100？

近日，ARC Prize 官方发布了针对这两款顶级模型的详细分析报告，结果令人震惊：在面对未见过的逻辑任务时，两者的表现得分均低于 1%，GPT-5.5 得分 0.43%，Claude Opus 4.7 得分 0.18%。

来自主题: AI技术研报

9226 点击 2026-05-02 15:00

GPT-5.6现身后，下一个Claude Sonnet 4.8又曝光了！

GPT-5.5发布没几天，后台日志里就冒出了GPT-5.6；Anthropic的一个从未见过的代号——Jupiter也炸出了！两天之内，两家巨头的下一代模型同时浮出水面。新一轮模型军备竞赛，比我们想的都要快！

来自主题: AI资讯

9985 点击 2026-05-02 13:37

GPT-Image-2爆火半个月后，我采访了10个普通人

当AI生图真的开始被普通人使用，它会先被用在哪里？所以这次我没有继续测模型或者写Prompt分享。而是去找了10个身边的普通人，问他们怎么开始用AI生图，又为什么会在这些具体的小事上用到它。

来自主题: AI资讯

7862 点击 2026-05-02 13:35

等 DeepSeek 回复的 30 秒，是手机最好玩的半小时

你要是问当今互联网最神秘、最玄学、连量子力学都解释不清的「时空裂缝」在哪里？它不在百慕大，也不在诺兰导演的电影里，而是在你的 DeepSeek、Claude 或者 ChatGPT 正在思考的过程里。

来自主题: AI资讯

8561 点击 2026-05-02 10:59

OpenAI突然宣布：ChatGPT账号进入「高危模式」！密码直接废掉，丢了钥匙连客服都不管你

OpenAI 昨天扔了一个重磅炸弹——ChatGPT 账户正式上线「高级账户安全（AAS）」模式，直接禁用密码登录、砍掉邮箱短信找回，逼你用物理安全密钥或 passkey。更狠的是，OpenAI 官方明说：

来自主题: AI资讯

10882 点击 2026-05-01 22:48

撕开Claude Code真相：让它好用的98.4%，是工程不是AI

你还在ChatGPT的聊天框里反复调prompt？最近，一位X用户发了条推文，开头就是一个惊呼：头部大厂偷偷在用的Claude Code项目模板外泄！这已经不是写提示词了。这是AI工程基础设施。

来自主题: AI资讯

8527 点击 2026-05-01 13:34

有人只用API就猜出了GPT、Claude、Gemini的参数量？社区吵翻了

基于此，研究者在 89 个参数量已知的开源模型（规模从 1.35 亿到 1.6 万亿参数）上拟合出事实准确率与参数量的对数线性关系，拟合优度 R² = 0.917，并据此对闭源模型进行参数估算。

来自主题: AI技术研报

9262 点击 2026-05-01 13:13

GPT Image 2研究科学家陈博远：我在OpenAI修中文

GPT Image 2的发布给整个AI圈带来了亿点点震撼。但很多人可能没注意到，幕后最会玩梗的居然是他——主力训练者陈博远。他和奥特曼同台主持，悄悄修好了中文渲染；给模型起代号“布基胶带”，还拿香蕉艺术品玩梗；为了秀模型的文字能力，设计了米粒刻字、漫画套娃、视觉证明题这些“彩蛋级”测试。

来自主题: AI资讯

8269 点击 2026-05-01 11:07

ChatGPT数学进阶之路！OpenAI研究员自爆：ChatGPT从数不清数到给出埃尔德什问题全新解法；数学是衡量模型进步的重要基准；AI自动化研究员

今天，OpenAI 官方播客发布了一期节目，让内部研究员 Sebastian Bubeck 和 Ernest Ryu 出来回答这一问题，毕竟大家都十分好奇。Ernest 近期刚加入 OpenAI 担任研究员，他之前是加州大学洛杉矶分校（UCLA）数学系的教授，研究优化和机器学习理论。他是最早尝试用 ChatGPT 解数学开放问题的那批人之一。

来自主题: AI资讯

8445 点击 2026-05-01 10:59

OpenAI公告正经解释：为什么GPT-5.5爱说“哥布林”

OpenAI正儿八经写了一篇研究复盘，标题看起来却像个段子： GPT-5.5爱说哥布林，正是这两天OpenAI用户最热议话题。起初，是有人发现Codex系统提示词中特别强调了两遍：禁止谈论哥布林、妖精、巨魔等生物。

来自主题: AI资讯

8111 点击 2026-04-30 13:53