AI资讯新闻榜单内容搜索-算法

仅0.2B就比GPT-4.1强？加州大学新指标：组合推理基准首次超越人类

加州大学河滨分校团队发现，AI组合推理表现不佳部分源于评测指标过于苛刻。他们提出新指标GroupMatch和Test-Time Matching算法，挖掘模型潜力，使GPT-4.1在Winoground测试中首次超越人类，0.2B参数的SigLIP-B16在MMVP-VLM基准测试上超越GPT-4.1并刷新最优结果。这表明模型的组合推理能力早已存在，只需合适方法在测试阶段解锁。

来自主题: AI技术研报

8093 点击 2025-11-09 15:33

SimKO：缓解RLVR训练中的概率过度集中，优化pass@K性能

研究团队提出一种简洁且高效的算法 ——SimKO (Simple Pass@K Optimization)，显著优化了 pass@K（K=1 及 K>1）性能。同时，团队认为当前的用熵（Entropy）作为指标衡量多样性存在局限：熵无法具体反映概率分布的形态。如图 2（c）所示，两个具有相同熵值的分布，一个可能包含多个峰值，而另一个则可能高度集中于一个峰值。

来自主题: AI技术研报

7894 点击 2025-11-08 15:48

只用国产GPU训练的大模型性能飙升100%！国内唯一，更懂你

刚刚，唯一全国产算力训出的大模型重磅升级，推理效率飙升100%，数学能力国际领先。当全球巨头还在云端「卷」算法时，中国队则亮出了软硬一体这一截然不同的底牌。

来自主题: AI资讯

9981 点击 2025-11-07 10:14

清北联合推出Motion Transfer，比肩Gemini Robotics，让机器人直接从人类数据中端到端学习技能

近期，Google DeepMind 发布新一代具身大模型 Gemini Robotics 1.5，其核心亮点之一便是被称为 Motion Transfer Mechanism（MT）的端到端动作迁移算法 —— 无需重新训练，即可把不同形态机器人的技能「搬」到自己身上。不过，官方技术报告对此仅一笔带过，细节成谜。

来自主题: AI技术研报

9353 点击 2025-11-05 16:39

产品还是个文件夹，投资人抢着砸钱：只因她是「前OpenAI」？

十年前，「黑手党」这个词还属于PayPal。十年后，它成了OpenAI。那些离开OpenAI的人，没有远去，而是在外部重建另一个OpenAI。他们互相投资、互相背书，从算法到资本，织出一张无形的权力网。AI的故事，看似在讲技术，其实是在讲权力的继承。当算法学会模仿人类，人类也在用算法，复制自己的帝国。

来自主题: AI资讯

6693 点击 2025-11-05 11:01