AI资讯新闻榜单内容搜索-EMMA

一张4090就能爆改！面壁智能MiniCPM-V 4.6开源，1B多模态卷出新高度

面壁智能正式发布并开源了 MiniCPM-V 系列新一代基础模型——MiniCPM-V 4.6。这款模型的整体参数规模仅约 1B（1.3B），是该系列有史以来参数规模最小的一款。但在多模态综合能力上，它却成功超越了被视为标杆的阿里 Qwen3.5-0.8B 和谷歌 Gemma 4 E2B-it，做到了「尺寸更小、效率更高、性能更好」。

来自主题: AI资讯

9253 点击 2026-05-13 11:57

只要24GB 内存，能在本地 Mac上跑无限制的Gemma 4 31B了

有个31B参数的大模型，正常需要80GB显存才能跑。但现在，24GB显存就能跑满血版。这个版本叫Gemma-4-31B-JANG_4M-CRACK——"CRACK"这个词不要理解歪了，它本质是量化压缩加上对齐微调之后的部署版本，不是什么黑客攻击，就是工程优化。24GB，MacBook Pro，直接跑。苹果用户优先优化，MLX原生支持，月下载13000次。

来自主题: AI资讯

9542 点击 2026-05-10 11:39

不改模型、不降质量，谷歌让Gemma 4快了3倍：本地跑大模型彻底变天

谷歌刚刚给Gemma 4家族更新了一项关键能力：Multi-Token Prediction（MTP）推测解码架构，推理速度最高提升3倍，输出质量不变。

来自主题: AI资讯

9597 点击 2026-05-06 14:56

都是你能部署的：Qwen3.6和Gemma4，谁更适合作为你的下一代本地MoE模型？

阿里前几天开源的Qwen3.6-35B-A3B，让这次讨论不再只是一次普通的新旧模型对比。它一边要面对谷歌Gemma4-26B-A4B的外部竞争，一边又必须回答一个更麻烦的问题：相较于 Qwen3.5-35B-A3B，它到底是升级，还是修补？更现实的是，很多人现在真正跑着的，其实是Qwen3.5-27B，那么这条新的35B-A3B路线，到底值不值得迁过去。

来自主题: AI技术研报

9568 点击 2026-04-23 09:23

Mac用户可以在oMLX中使用TurboQuant了，搭配Gemma-4-31B，谷歌全家桶实测很能打！

对本地部署玩家，尤其是Mac用户来说，长上下文推理最大的痛点往往不是“模型不够聪明”，而是稍微多用点上下文，统一内存就被撑爆了”，这一点在最近的Gemma-4 31B的部署中尤为明显，在同等上下文的情况，显存占用比Qwen3.5-27B高约一倍不止，直接劝退了不少人。但好消息是，谷歌近期提出的TurboQuant KV缓存量化算法，正是为了解决这个痛点而生。

来自主题: AI技术研报

8712 点击 2026-04-09 09:47

谷歌的Gemma-4-31B适合哪些人？值得你放弃Qwen3.5-27B吗？深度调研战略报告

Gemma4 31B的发布，在开源模型社区引发了巨大的关注。面对这款由谷歌DeepMind于2026年4月2日推出的重磅模型，很多技术团队和本地部署玩家都在问同一个问题：Gemma4的出现，到底是在开辟一条新的本地部署路线，还是只是给高端玩家多了一个可选项？我们到底需不需要把现有的Qwen3.5 27B工作流整体迁移过去？

来自主题: AI技术研报

9437 点击 2026-04-08 16:29

重磅！Google Gemma-4-31B 模型被彻底破解！【附越狱版下载链接】

Google 最新发布的 Gemma-4-31B 基础模型出现了越狱版本，安全限制被完全移除。这个名为"Gemma-4-31B-JANG_4M-CRACK"的模型已经公开发布在 Hugging Face 上，任何人都可以下载使用。

来自主题: AI资讯

13989 点击 2026-04-06 20:32

iPhone本地跑Gemma 4火了，0 token时代还有多远？

一个 X 用户的帖子被围观数十万次。他在帖子里放了一个视频，讲述自己如何在 iPhone 上本地运行 Gemma 4，包括处理图片、音频、控制手电筒开关。他表示，Gemma 4 速度快得惊人，感觉像魔法一样。

来自主题: AI资讯

9158 点击 2026-04-06 13:53

谷歌Gemma 4深夜突降，31B爆杀20倍巨头！手机跑全血「龙虾」

谷歌深夜掏家底！Gemma 4全系开源，仅用31B越级斩杀20倍体量巨头。数学能力暴涨68%，硬生生把前代打成计量单位，开源界迎来终极大洗牌！

来自主题: AI资讯

9968 点击 2026-04-03 14:07

谷歌重磅开源Gemma 4！手机离线跑 Agent、还降内存，Qwen 被拉进正面对决

刚刚，谷歌正式发布 Gemma 4，称“这是其迄今为止最智能的开放模型系列”。该系列面向复杂推理与智能体工作流设计，采用商业许可的 Apache 2.0 许可证开源。Gemma 4 提供四种规格：Effective 2B（E2B）、Effective 4B（E4B）、26B 混合专家模型（MoE）和 31B 稠密模型（Dense）。

来自主题: AI资讯

9800 点击 2026-04-03 01:35