AI资讯新闻榜单内容搜索-GPT-4.1

这11个小技巧，GPT-5.5和Claude 4.7的Token 烧得更值 | 附官方指南

OpenAI 和 Anthropic 几乎在同一时间发布自己的提示词文档，在 OpenAI 官网，从 GPT-4.1 到 GPT 5.5，每次新模型发布都有一份完整的提示词指南，告诉我们怎么用新的模型。

来自主题: AI资讯

9564 点击 2026-05-02 21:45

Claude惨遭停用, GPT-4.1接任! 绝密备忘录怒撕「硅谷甄嬛」奥特曼

一份绝密备忘录爆出，Dario Amodei彻底撕碎了OpenAI，怒喷「安全作秀」做样子给所有人看。但不可否认的是，美国务院正大面积抛弃Claude，接入GPT-4.1。

来自主题: AI资讯

9923 点击 2026-03-05 14:56

仅0.2B就比GPT-4.1强？加州大学新指标：组合推理基准首次超越人类

加州大学河滨分校团队发现，AI组合推理表现不佳部分源于评测指标过于苛刻。他们提出新指标GroupMatch和Test-Time Matching算法，挖掘模型潜力，使GPT-4.1在Winoground测试中首次超越人类，0.2B参数的SigLIP-B16在MMVP-VLM基准测试上超越GPT-4.1并刷新最优结果。这表明模型的组合推理能力早已存在，只需合适方法在测试阶段解锁。

来自主题: AI技术研报

8068 点击 2025-11-09 15:33

刚刚，大模型棋王诞生！40轮血战，OpenAI o3豪夺第一，人类大师地位不保？

继Kaggle Game Arena的淘汰赛后，国际象棋积分赛成果出炉！OpenAI o3以人类等效Elo 1685分傲视群雄，而Grok 4和Gemini 2.5 Pro紧随其后。DeepSeek R1和GPT-4.1、Claude Sonnet-4、Claude Opus-4并列第五。

来自主题: AI资讯

8622 点击 2025-08-23 13:17

中国AI开源16强，最新出炉

知名AI大模型评测Chatbot Arena放榜！阿里Qwen3-235B-A22B-Instruct-2507位列大语言模型总榜第三，月之暗面Kimi-K2-0711-preview、深度求索DeepSeek-R1-0528并列为总榜第五，以开源之姿超越Claude 4、GPT-4.1等顶尖闭源模型。

来自主题: AI资讯

11136 点击 2025-08-05 10:47