AI资讯新闻榜单内容搜索-Qwen

名师一定出高徒？清华团队最新揭秘：别再迷信大模型蒸馏的「免费午餐」

当下的大模型后训练（Post-training）pipeline 中，On-Policy Distillation（OPD）已经成为了明星技术。从 Qwen3、MiMo 到 GLM-5，业界纷纷采用 OPD 并报告了巨大的性能提升。相比于强化学习（RL）稀疏的结果奖励，OPD 提供了密集的 Token 级别监督信号，看起来就像是一顿「免费的午餐」。

来自主题: AI技术研报

9502 点击 2026-05-14 09:59

一张4090就能爆改！面壁智能MiniCPM-V 4.6开源，1B多模态卷出新高度

面壁智能正式发布并开源了 MiniCPM-V 系列新一代基础模型——MiniCPM-V 4.6。这款模型的整体参数规模仅约 1B（1.3B），是该系列有史以来参数规模最小的一款。但在多模态综合能力上，它却成功超越了被视为标杆的阿里 Qwen3.5-0.8B 和谷歌 Gemma 4 E2B-it，做到了「尺寸更小、效率更高、性能更好」。

来自主题: AI资讯

8528 点击 2026-05-13 11:57

Claude团队用Qwen测试全新训练方法

别人做AI中训练都在堆语料、补知识。

来自主题: AI技术研报

7289 点击 2026-05-07 15:01

独家｜字节迎战阿里快乐马：开源多模统一模型Mamoda2.5，推理速度快18倍

独家获悉，字节跳动日前低调公布全球首个25B级、基于混合专家 (MoE) -扩散自注意力机制(DiT) 的开源增强统一多模态模型Mamoda2.5。Mamoda2.5依托Qwen3-VL-8B、128 个专家，Top-8 路由的MoE+DiT架构搭建，最终模型参数高达250亿，而每次仅激活约30亿参数（约12%）。

来自主题: AI资讯

9562 点击 2026-05-06 10:44

SkVM：优化你的Skills能够跨模型、跨Harness、跨环境稳定运行｜SJTU最新

如果您经常用Claude Code、OpenCode、OpenClaw这类Agent框架，大概率会遇到一种不稳定现象：同一个Skills，用Claude能跑，换成Qwen就不行了；在Claude Code里稳定的流程，换到OpenClaw可能输出格式崩掉；在作者环境里正常的脚本，到了自己机器上可能因为缺依赖进入反复报错。

来自主题: AI技术研报

10155 点击 2026-05-06 09:08

不可思议！400B大模型在iPhone上跑起来了

刚看到这个 Demo 的时候着实有些想笑，很久没有见过吐词如此之慢的大模型了。观感上就像「闪电」老师。尽管只有每秒 0.6 个 tokens 的输出速率，这依旧是一个令人不可思议的工作。因为这是一个跑在 iPhone 17 Pro 上的 400B 大模型！

来自主题: AI资讯

9768 点击 2026-05-02 11:02

65元，免费开源！实时AI语音伴侣，Arduino编程 ESP32开发板，支持DeepSeek、Qwen、豆包，跨设备无缝对话

ElatoAI 是一个开源免费的实时AI语音交互系统，采用Arduino 编程，运行在乐鑫 ESP32 主控制器上，通过安全WebSocket连接至部署在Deno边缘函数构建的服务端，通过OpenAI Realtime API等技术实现低成本、长时长、跨设备的自然对话体验，支持多种AI模型，

来自主题: AI资讯

9706 点击 2026-05-01 11:10

实测Qwen3.6-27B：4分钟做了个跑酷游戏，验证码识别正确率超90%

Qwen3.6系列全员集结完毕。

来自主题: AI产品测评

6389 点击 2026-04-24 10:12

27B秒了自家397B旗舰，Qwen3.6-27B开源，智能体编程全面超越前代

我秒了我自己？？

来自主题: AI技术研报

5992 点击 2026-04-24 09:13

都是你能部署的：Qwen3.6和Gemma4，谁更适合作为你的下一代本地MoE模型？

阿里前几天开源的Qwen3.6-35B-A3B，让这次讨论不再只是一次普通的新旧模型对比。它一边要面对谷歌Gemma4-26B-A4B的外部竞争，一边又必须回答一个更麻烦的问题：相较于 Qwen3.5-35B-A3B，它到底是升级，还是修补？更现实的是，很多人现在真正跑着的，其实是Qwen3.5-27B，那么这条新的35B-A3B路线，到底值不值得迁过去。

来自主题: AI技术研报

8790 点击 2026-04-23 09:23

AI资讯新闻榜单内容搜索-Qwen

名师一定出高徒？清华团队最新揭秘：别再迷信大模型蒸馏的「免费午餐」

一张4090就能爆改！面壁智能MiniCPM-V 4.6开源，1B多模态卷出新高度

Claude团队用Qwen测试全新训练方法

独家｜字节迎战阿里快乐马：开源多模统一模型Mamoda2.5，推理速度快18倍

SkVM：优化你的Skills能够跨模型、跨Harness、跨环境稳定运行 ｜SJTU最新

不可思议！400B大模型在iPhone上跑起来了

65元，免费开源！实时AI语音伴侣，Arduino编程 ESP32开发板，支持DeepSeek、Qwen、豆包，跨设备无缝对话

实测Qwen3.6-27B：4分钟做了个跑酷游戏，验证码识别正确率超90%

27B秒了自家397B旗舰，Qwen3.6-27B开源，智能体编程全面超越前代

都是你能部署的：Qwen3.6和Gemma4，谁更适合作为你的下一代本地MoE模型？

SkVM：优化你的Skills能够跨模型、跨Harness、跨环境稳定运行｜SJTU最新