AI资讯新闻榜单内容搜索-Qwen3

一张4090就能爆改！面壁智能MiniCPM-V 4.6开源，1B多模态卷出新高度

面壁智能正式发布并开源了 MiniCPM-V 系列新一代基础模型——MiniCPM-V 4.6。这款模型的整体参数规模仅约 1B（1.3B），是该系列有史以来参数规模最小的一款。但在多模态综合能力上，它却成功超越了被视为标杆的阿里 Qwen3.5-0.8B 和谷歌 Gemma 4 E2B-it，做到了「尺寸更小、效率更高、性能更好」。

来自主题: AI资讯

9243 点击 2026-05-13 11:57

独家｜字节迎战阿里快乐马：开源多模统一模型Mamoda2.5，推理速度快18倍

独家获悉，字节跳动日前低调公布全球首个25B级、基于混合专家 (MoE) -扩散自注意力机制(DiT) 的开源增强统一多模态模型Mamoda2.5。Mamoda2.5依托Qwen3-VL-8B、128 个专家，Top-8 路由的MoE+DiT架构搭建，最终模型参数高达250亿，而每次仅激活约30亿参数（约12%）。

来自主题: AI资讯

10170 点击 2026-05-06 10:44

不可思议！400B大模型在iPhone上跑起来了

刚看到这个 Demo 的时候着实有些想笑，很久没有见过吐词如此之慢的大模型了。观感上就像「闪电」老师。尽管只有每秒 0.6 个 tokens 的输出速率，这依旧是一个令人不可思议的工作。因为这是一个跑在 iPhone 17 Pro 上的 400B 大模型！

来自主题: AI资讯

10161 点击 2026-05-02 11:02

实测Qwen3.6-27B：4分钟做了个跑酷游戏，验证码识别正确率超90%

Qwen3.6系列全员集结完毕。

来自主题: AI产品测评

6996 点击 2026-04-24 10:12

27B秒了自家397B旗舰，Qwen3.6-27B开源，智能体编程全面超越前代

我秒了我自己？？

来自主题: AI技术研报

6431 点击 2026-04-24 09:13

都是你能部署的：Qwen3.6和Gemma4，谁更适合作为你的下一代本地MoE模型？

阿里前几天开源的Qwen3.6-35B-A3B，让这次讨论不再只是一次普通的新旧模型对比。它一边要面对谷歌Gemma4-26B-A4B的外部竞争，一边又必须回答一个更麻烦的问题：相较于 Qwen3.5-35B-A3B，它到底是升级，还是修补？更现实的是，很多人现在真正跑着的，其实是Qwen3.5-27B，那么这条新的35B-A3B路线，到底值不值得迁过去。

来自主题: AI技术研报

9545 点击 2026-04-23 09:23

阿里发布旗舰模型预览版Qwen3.6-Max-Preview！我用这个“半成品”模型，亲手造了一个macOS桌面

今天，阿里发布了其下一代旗舰模型的早期预览版：Qwen3.6-Max-Preview。在第三方评测榜单Artificial Analysis的智能指数排名中，Qwen3.6-Max-Preview的得分为52分，小幅超过GLM-5.1、MiniMax-M2.7，成为这一榜单上得分最高的国产模型。

来自主题: AI资讯

8669 点击 2026-04-20 22:21

首个Qwen3.6开源模型来了！编程视觉双提升，还兼容OpenClaw

3B激活参数，视觉能力直逼Claude Sonnet 4.5。

来自主题: AI资讯

9162 点击 2026-04-17 10:07

日嫖1000次！Qwen3.6反代API接入任意工具

昨天我发现 Qwen3.6“倒反天罡”。

来自主题: AI技术研报

8960 点击 2026-04-13 15:02

Mac用户可以在oMLX中使用TurboQuant了，搭配Gemma-4-31B，谷歌全家桶实测很能打！

对本地部署玩家，尤其是Mac用户来说，长上下文推理最大的痛点往往不是“模型不够聪明”，而是稍微多用点上下文，统一内存就被撑爆了”，这一点在最近的Gemma-4 31B的部署中尤为明显，在同等上下文的情况，显存占用比Qwen3.5-27B高约一倍不止，直接劝退了不少人。但好消息是，谷歌近期提出的TurboQuant KV缓存量化算法，正是为了解决这个痛点而生。

来自主题: AI技术研报

8706 点击 2026-04-09 09:47