AI资讯新闻榜单内容搜索-模型训练

谷歌之后，英伟达入局扩散大语言模型，Fast-dLLM推理速度狂飙27.6倍

近日，NVIDIA 联合香港大学、MIT 等机构重磅推出 Fast-dLLM，以无需训练的即插即用加速方案，实现了推理速度的突破！通过创新的技术组合，在不依赖重新训练模型的前提下，该工作为扩散模型的推理加速带来了突破性进展。本文将结合具体技术细节与实验数据，解析其核心优势。

来自主题: AI技术研报

9915 点击 2025-05-30 12:08

主席在《矛盾论》中强调"具体问题具体分析，是Marxism的活的灵魂"。而在AI领域，我们终于有了一个能够践行这一哲学思想的技术框架——MAS-ZERO，帮我们构建能够因地制宜、因时制宜的智能系统。

来自主题: AI技术研报

8156 点击 2025-05-30 12:03

来自上海人工智能实验室团队的最新成果 Linear-MoE，首次系统性地实现了线性序列建模与 MoE 的高效结合，并开源了完整的技术框架，包括 Modeling 和 Training 两大部分，并支持层间混合架构。为下一代基础模型架构的研发提供了有价值的工具和经验。

来自主题: AI技术研报

9584 点击 2025-05-30 12:03

Pangu Ultra MoE 是一个全流程在昇腾 NPU 上训练的准万亿 MoE 模型，此前发布了英文技术报告[1]。最近华为盘古团队发布了 Pangu Ultra MoE 模型架构与训练方法的中文技术报告，进一步披露了这个模型的细节。

来自主题: AI技术研报

10323 点击 2025-05-29 16:47

视觉语言模型（Vision-Language Models, VLMs），为真实环境中的机器人操作任务提供了极具潜力的解决方案。

来自主题: AI技术研报

10515 点击 2025-05-29 16:33

AI越来越聪明，但如果它们反应慢，效率低，也难以满足我们的需求。

来自主题: AI技术研报

7555 点击 2025-05-29 15:19

全球最贵估值科技公司，AI 巨头 Palantir 如何合理定价？

来自主题: AI技术研报

11118 点击 2025-05-29 15:18

你是否曾对大语言模型（LLMs）下达过明确的“长度指令”？

来自主题: AI技术研报

9840 点击 2025-05-29 15:12

复刻DeepSeek-R1的长思维链推理，大模型强化学习新范式RLIF成热门话题。

来自主题: AI技术研报

9791 点击 2025-05-29 15:10

即使RLVR（可验证奖励强化学习）使用错误的奖励信号，Qwen性能也能得到显著提升？

来自主题: AI技术研报

9664 点击 2025-05-29 15:01