AI资讯新闻榜单内容搜索-预训练

李飞飞团队提出架构设计新思路！无需从头训练，直接“嫁接”预训练模型关键组件

预训练模型能否作为探索新架构设计的“底座” ？最新答案是：yes！

来自主题: AI技术研报

8361 点击 2025-06-20 15:38

清华大学软件学院发布生成式时序大模型——日晷（Sundial）。告别离散化局限，无损处理连续值，基于流匹配生成预测，缓解预训练模式坍塌，支持非确定性概率预测，为决策过程提供动态支持。

来自主题: AI资讯

8357 点击 2025-06-20 15:34

OpenAI发布最新论文，找了到控制AI“善恶”的开关。

来自主题: AI技术研报

7541 点击 2025-06-19 11:09

扩散模型风头正盛，何恺明最新论文也与此相关。研究的是如何把扩散模型和表征学习联系起来—— 给扩散模型加上“整理收纳”功能，使其内部特征更加有序，从而生成效果更加自然逼真的图片。

来自主题: AI技术研报

6068 点击 2025-06-13 12:49

谁说强化学习只能是蛋糕上的樱桃，说不定，它也可以是整个蛋糕呢？

来自主题: AI技术研报

5302 点击 2025-06-11 14:58

为提升大模型“推理+搜索”能力，阿里通义实验室出手了。

来自主题: AI技术研报

7273 点击 2025-05-31 16:19

全球网友用闲置显卡组团训练大模型。40B大模型、20万亿token，创下了互联网上最大规模的预训练新纪录！去中心化AI的反攻，正式开始。OpenAI等巨头的算力霸权，这次真要凉了？

来自主题: AI资讯

4886 点击 2025-05-26 14:42

何恺明团队又一力作！这次他们带来的是「生成模型界的降维打击」——MeanFlow：无需预训练、无需蒸馏、不搞课程学习，仅一步函数评估（1-NFE），就能碾压以往的扩散与流模型！

来自主题: AI技术研报

4893 点击 2025-05-21 14:50

如今，C端产品已经淡出零一万物的业务版图，To B成为核心。

来自主题: AI资讯

5907 点击 2025-05-19 16:51

我们发现，当模型在测试阶段花更多时间思考时，其推理表现会显著提升，这打破了业界普遍依赖预训练算力的传统认知。

来自主题: AI资讯

8122 点击 2025-05-18 14:56