AI资讯新闻榜单内容搜索-N2

Sora 2瑟瑟发抖！通义万相2.5放大招：一句话出1080P电影，音画精准同步

Veo 3真正对手，竟不是Sora 2！通义万相2.5全网首发，直接甩出王炸：一句话，直出10秒1080P电影级视频，首次实现音画精准同步。一键生成BGM、人声，全网实测玩疯。

来自主题: AI资讯

10393 点击 2025-09-25 16:04

Wan2.5+Midjourney V7，阿里夸克这个新AI鲨疯了！价格还砍一大刀

夸克“造点”AI发布了！直接上大招，Wan2.5+Midjourney V7双强模型联合！夸克“造点”还在今天第一时间，率先接入了阿里自家刚刚发布的视频生成模型通义万相Wan2.5，甚至直接开放了7天免费体验。

来自主题: AI资讯

10331 点击 2025-09-25 11:37

扩散语言模型有MoE版了！蚂蚁&人大从头训练LLaDA-MoE，将完全开源

挑战自回归的扩散语言模型刚刚迎来了一个新里程碑：蚂蚁集团和人大联合团队用 20T 数据，从零训练出了业界首个原生 MoE 架构扩散语言模型 LLaDA-MoE。该模型虽然激活参数仅 1.4B，但性能可以比肩参数更多的自回归稠密模型 Qwen2.5-3B，而且推理速度更快。这为扩散语言模型的技术可行性提供了关键验证。

来自主题: AI技术研报

9356 点击 2025-09-15 08:30

断供？会“刻意练习”的Qwen2.5-3B，竟然超越Claude3.5！斯坦福最新

来自斯坦福的研究者们最近发布的一篇论文（https://arxiv.org/abs/2509.01684）直指RL强化学习在机器学习工程（Machine Learning Engineering）领域的两个关键问题，并克服了它们，最终仅通过Qwen2.5-3B便在MLE任务上超越了仅依赖提示（prompting）的、规模更大的静态语言模型Claude3.5。

来自主题: AI资讯

8334 点击 2025-09-06 11:35

阿里开源14B电影级视频模型！实测来了：免费可玩，单次生成时长可达分钟级

AI视频生成正在迎来“通义时刻”！就在昨夜，阿里突然发布了一款由音频驱动的14B视频模型Wan2.2-S2V—— 仅需一张图片和一段音频，即可生成面部表情自然、口型一致、肢体动作丝滑的电影级数字人视频。

来自主题: AI资讯

8363 点击 2025-08-27 18:43

教AI「择偶生娃」，复刻自然演化！上交校友提名最佳论文

Sakana AI以自然演化为灵感，提出了一种全新的模型融合进化方法M2N2。通过引入自然界的「择偶机制」，AI可以像生物一样「竞争、择偶、繁衍」。在当前全球算力短缺、模型训练实际规模受制的情况下，Sakana AI借助自然界的启示，为模型融合探索出了一条新路。

来自主题: AI技术研报

9254 点击 2025-08-27 12:29

多模态新旗舰MiniCPM-V 4.5：8B 性能超越 72B，高刷视频理解又准又快

今天，我们正式开源 8B 参数的面壁小钢炮 MiniCPM-V 4.5 多模态旗舰模型，成为行业首个具备“高刷”视频理解能力的多模态模型，看得准、看得快，看得长！高刷视频理解、长视频理解、OCR、文档解析能力同级 SOTA，且性能超过 Qwen2.5-VL 72B，堪称最强端侧多模态模型。

来自主题: AI资讯

10832 点击 2025-08-26 23:30

刚刚，阿里图像编辑大杀器Qwen-Image-Edit上线，横扫像素与语义编辑，网友：再见PS

今天凌晨，阿里推出了最新图像编辑模型 Qwen-Image-Edit！该模型基于 200 亿参数的 Qwen-Image 架构构建，支持中英文双语精准文本编辑，在保持原有风格的同时完成修改。此外，Qwen-Image-Edit 将输⼊图像同时输⼊到 Qwen2.5-VL（实现视觉语义控制）和 VAE Encoder（实现视觉外观控制），兼具语义与外观的双重编辑能⼒。

来自主题: AI资讯

10241 点击 2025-08-19 08:52

一夜颠覆Sora神话，H200单卡5秒出片！全华人团队开源AI引爆视频圈

AI视频生成进入了秒生极速时代！UCSD等机构发布的FastWan系模型，在一张H200上，实现了5秒即生视频。稀疏蒸馏，让去噪时间大减，刷新SOTA。

来自主题: AI资讯

7718 点击 2025-08-07 17:55

小米模型实现声音理解新SOTA！数据吞吐效率暴增20倍，推理速度快4倍 | 全量开源

声音理解能力新SOTA，小米全量开源了模型。 MiDashengLM-7B，基于Xiaomi Dasheng作为音频编码器和Qwen2.5-Omni-7B Thinker作为自回归解码器，通过创新的通用音频描述训练策略，实现了对语音、环境声音和音乐的统一理解。

来自主题: AI技术研报

7466 点击 2025-08-06 12:11