AI资讯新闻榜单内容搜索-GPT-5.3

微软Terminus-4B之后，Agent可能会进入「专用小模型Sub Agent」时代

您有没有想过：在代码Agent里，执行终端命令、跑测试、读报错、总结日志这种任务，用Claude Opus、Claude Sonnet、GPT-5.3-Codex这类昂贵Token的大模型来执行，是不是有点浪费？一定要这么做吗？

来自主题: AI技术研报

7829 点击 2026-05-14 10:01

刚刚，GPT-5.5 Instant 发布，奥特曼还邀请马斯克参加 AI 办的派对

就在刚刚，OpenAI 正式发布了 GPT-5.5 Instant，将其设为 ChatGPT 的默认模型，取代此前的 GPT-5.3 Instant，面向所有用户开放。Instant 系列是 ChatGPT 的日常主力模型，每天有数以亿计的用户在用。官方说，在这个量级上，哪怕只是小幅改进，积累起来的效果也相当可观。

来自主题: AI资讯

9993 点击 2026-05-06 08:07

OpenAI连夜爆出GPT-5.4! 紧急上新GPT-5.3反击谷歌, AI爹味治好了

GPT-5.3 Instant不卷跑分，专治「聊天翻车」：不再动不动拒绝回答，不再满嘴说教免责，幻觉率暴降27%，写作能力也跳了一个台阶。

来自主题: AI资讯

10493 点击 2026-03-04 11:29

OpenAI史上最快模型降临，每秒1000Token！代码从此「炸出来」

OpenAI深夜突袭，GPT-5.3-Codex-Spark正式炸场。核心卖点只有一个：快！每秒1000个token，让代码生成告别加载条。联手Cerebras怪兽级硬件，物理外挂直接拉满。这不再是简单的工具升级。而是一场关于速度的暴力美学。

来自主题: AI资讯

10182 点击 2026-02-14 18:38

决定了：过年攻略全都不过脑子，让AI去想

春节还没到，「过年的气氛」已经渗入科技圈每个人的毛孔。单说 AI 大模型这一块，刚刚发布的有 kimi 2.5 和 Step 3.5 Flash，即将发布的据说还有 DeepSeek V4，GPT-5.3、Claude Sonnet 5、Qwen 3.5，GLM-5，说不定一觉醒来，现有的技术就要被颠覆。

来自主题: AI技术研报

6806 点击 2026-02-12 15:32

比肩OpenAI Simple Codex，中国团队Feeling AI闯入Terminal-Bench全球第二！

就在这个被 Anthropic 和 OpenAI 视为衡量 Agent 真实工程能力全球权威基准 Terminal-Bench 2.0 榜单上，中国团队 Feeling AI 凭借 CodeBrain-1，搭载最新 GPT-5.3-Codex 底座模型，一举冲到 72.9%(70.3%) 并跻身全球排行榜第二，成为榜单前 10 中唯一的中国团队。

来自主题: AI资讯

11570 点击 2026-02-10 18:51