AI资讯新闻榜单内容搜索-闭源模型

腾讯把翻译大模型Hy-MT2塞进了手机，没网也能用，性能还逼近Gemini

你猜一个能翻译33种语言、性能逼近顶尖闭源模型的AI，装进手机里需要多大？

来自主题: AI资讯

6350 点击 2026-05-22 09:28

token级，精准控制生成长度：3B模型击败GPT 5.4、Claude

LenVM将长度建模提升到token级别，开辟可扩展价值预训练的新维度——3B开源模型精确长度控制全面击败GPT-5.4、Claude-Opus-4-6等顶级闭源模型；相同token预算下推理准确率提升10倍（63% vs 6%）；沿模型规模、数据量、采样数三轴无饱和scaling的value pretraining

来自主题: AI技术研报

6043 点击 2026-05-08 14:06

有人只用API就猜出了GPT、Claude、Gemini的参数量？社区吵翻了

基于此，研究者在 89 个参数量已知的开源模型（规模从 1.35 亿到 1.6 万亿参数）上拟合出事实准确率与参数量的对数线性关系，拟合优度 R² = 0.917，并据此对闭源模型进行参数估算。

来自主题: AI技术研报

9251 点击 2026-05-01 13:13

MiniMax修改开源授权被骂疯了！限制M2.7商用、强制标注来源，却没完全撤下MIT标识

近日，刚带着对标顶级闭源模型的强悍性能登场不久的 MiniMax M2.7 模型，悄悄变更了开源使用条款。尽管先前将权重公开在 Hugging Face，但当下已然收紧授权：商业用途需获得 MiniMax 书面授权。非商业用途依旧免费且不受限制，科研、个人项目、自用微调等场景均不受影响；但若是搭建托管服务或开发商业产品，则必须申请授权。

来自主题: AI资讯

8554 点击 2026-04-14 15:15

SVG性能比肩GPT/Claude，腾讯开源3B模型HiVG，让Token「懂几何」

HiVG是一个面向SVG生成的层次化分词框架，在减少63.8% token数量的同时，以仅3B参数在多项指标上超越所有开源SVG模型和GPT-5.2等闭源模型。仅3B参数的HiVG，在SVG生成任务中多项指标超越了GPT-5.2、Claude-4.5-Sonnet等闭源模型。

来自主题: AI资讯

7996 点击 2026-04-10 16:04

正面硬刚Claude Opus 4.6：我们给GLM-5.1使了三个“绊子”，它居然…

今天，智谱正式开源其最强模型GLM-5.1，这一模型在专业软件开发基准测试SWE-Bench Pro中，GLM-5.1刷新全球最佳成绩，得分达到58.4，超过了GPT-5.4、Claude Opus 4.6等已经正式发布的闭源模型，和MiniMax M2.7、Kimi K2.5等开源模型。

来自主题: AI资讯

9701 点击 2026-04-08 14:15

刚刚，DeepSeek V4基准测试泄露！疑似明天发布，全场惊呼新王归来

DeepSeek V4，据说明天就要上线了？这是首个匹敌顶尖闭源模型的开源模型，被网友评为「一鲸落万物生」。泄露的基准测试显示，它在SWE-bench Verified上取得了83.7%，已经超越Opus 4.5和GPT-5.2！

来自主题: AI资讯

10407 点击 2026-02-16 20:04

印奇挂帅后，阶跃星辰最强开源模型Step 3.5 Flash登场！六大国产AI芯片已适配

今日，阶跃星辰Step 3.5 Flash开源并上线，该模型在Agent场景和数学任务上能力逼近闭源模型，能够胜任复杂、长链条任务，是阶跃星辰迄今最强的开源基座模型。就在上周，阶跃星辰宣布由旷视科技联合创始人、千里科技董事长印奇正式出任董事长，并完成华勤、腾讯等参投的超50亿元B+轮融资。这也是印奇履新后，阶跃星辰在开源模型领域的首个大动作。

来自主题: AI资讯

10644 点击 2026-02-02 14:24

斯坦福英伟达推出测试时强化学习：微调开源模型胜过顶级闭源模型，仅需几百美元

大模型持续学习，又有新进展！

来自主题: AI技术研报

9774 点击 2026-01-27 16:15

DeepSeek V4爆春节登场！四大杀招突袭全球编程王座，Claude危

Information爆料称，DeepSeek将计划在2月中旬，也正是春节前后，正式发布下一代V4模型。据称，DeepSeek V4编程实力可以赶超Claude、GPT系列等顶尖闭源模型。

来自主题: AI资讯

9941 点击 2026-01-10 11:23