AI资讯新闻榜单内容搜索-开源模型

阶跃发布Step 3.7 Flash：一款为「烧钱时代」准备的Agent模型

继 Step 3.5 Flash 后，阶跃星辰最近又推出新一代高效率 Flash 开源模型 ——Step 3.7 Flash。该模型最大特点就是多（模）、快（速）、好（用）、省（钱）。总参数 196B，采用稀疏 MoE 架构，推理激活参数仅 11B，配备 1.88B ViT 视觉编码器，推理速度最高 400 TPS，支持 256K 上下文。

来自主题: AI资讯

9512 点击 2026-05-29 17:06

一张4090就能爆改！面壁智能MiniCPM-V 4.6开源，1B多模态卷出新高度

面壁智能正式发布并开源了 MiniCPM-V 系列新一代基础模型——MiniCPM-V 4.6。这款模型的整体参数规模仅约 1B（1.3B），是该系列有史以来参数规模最小的一款。但在多模态综合能力上，它却成功超越了被视为标杆的阿里 Qwen3.5-0.8B 和谷歌 Gemma 4 E2B-it，做到了「尺寸更小、效率更高、性能更好」。

来自主题: AI资讯

9235 点击 2026-05-13 11:57

token级，精准控制生成长度：3B模型击败GPT 5.4、Claude

LenVM将长度建模提升到token级别，开辟可扩展价值预训练的新维度——3B开源模型精确长度控制全面击败GPT-5.4、Claude-Opus-4-6等顶级闭源模型；相同token预算下推理准确率提升10倍（63% vs 6%）；沿模型规模、数据量、采样数三轴无饱和scaling的value pretraining

来自主题: AI技术研报

6040 点击 2026-05-08 14:06

本地4B开源模型，把任何App当Skill用！告别token焦虑，私密性强～

上次给大家分享了一个 CUA 的开源项目，能让 AI Agent 直接操控电脑界面，相当于把任何 App 都变成 Agent 的 Skill。反响还不错。

来自主题: AI技术研报

7345 点击 2026-05-07 10:18

有人只用API就猜出了GPT、Claude、Gemini的参数量？社区吵翻了

基于此，研究者在 89 个参数量已知的开源模型（规模从 1.35 亿到 1.6 万亿参数）上拟合出事实准确率与参数量的对数线性关系，拟合优度 R² = 0.917，并据此对闭源模型进行参数估算。

来自主题: AI技术研报

9249 点击 2026-05-01 13:13

开源版的 GPT Image 2，信息图、连续图文、本地部署全拿下｜商汤SenseNova U1实测

SenseNova U1 是商汤最新发布的一个开源的多模态模型，它的 Lite 系列 8B 和 A3B 参数版本，目前已经在 Hugging Face 和 GitHub 上开源。APPSO 也提前拿到了测试资格，我们发现商汤这款新一代原生理解生成统一模型，就开源模型来说，已经做到了最好水平。

来自主题: AI产品测评

9978 点击 2026-04-29 19:51

超越DeepSeek-V4！罗福莉交出小米最强开源模型MiMo-V2.5-Pro，首日适配5家国产芯片

刚刚，小米开源罗福莉带队研发的MiMo-V2.5系列模型，采用MIT协议，允许商用推理部署与二次训练，无需额外授权。此前，该系列模型于4月23日开启公测，包括MiMo-V2.5-Pro、MiMo-V2.5两款模型。模型具备更强Agent能力，支持100万上下文，且Token效率大幅提升。

来自主题: AI资讯

9192 点击 2026-04-28 10:13

清华副教授代季峰创立Naive.ai，获约3亿美元融资

近日，AI创业公司Naive.ai的融资消息引发广泛关注。据多家媒体报道，这家由清华大学电子工程系副教授代季峰创立的新公司，已完成约3亿美元融资，估值约8亿美元。投资方包括一线基金和科技巨头，具体机构暂未披露。公司专注于开源模型的后训练和AI Agent方向，核心团队包括前MiroMind成员及联合创始人朱锡洲。

来自主题: AI资讯

7271 点击 2026-04-26 12:10

首个Qwen3.6开源模型来了！编程视觉双提升，还兼容OpenClaw

3B激活参数，视觉能力直逼Claude Sonnet 4.5。

来自主题: AI资讯

9160 点击 2026-04-17 10:07

万帧实时！流式3D重建天花板，被国产开源模型打破了

蚂蚁灵波，下了盘大棋。

来自主题: AI技术研报

6879 点击 2026-04-16 16:30