AI资讯新闻榜单内容搜索-预训练

首个「万亿级时间点」预训练，清华发布生成式时序大模型日晷 | ICML Oral

清华大学软件学院发布生成式时序大模型——日晷（Sundial）。告别离散化局限，无损处理连续值，基于流匹配生成预测，缓解预训练模式坍塌，支持非确定性概率预测，为决策过程提供动态支持。

来自主题: AI资讯

9262 点击 2025-06-20 15:34

OpenAI发布最新论文，找了到控制AI“善恶”的开关。

来自主题: AI技术研报

8174 点击 2025-06-19 11:09

扩散模型风头正盛，何恺明最新论文也与此相关。研究的是如何把扩散模型和表征学习联系起来—— 给扩散模型加上“整理收纳”功能，使其内部特征更加有序，从而生成效果更加自然逼真的图片。

来自主题: AI技术研报

7079 点击 2025-06-13 12:49

谁说强化学习只能是蛋糕上的樱桃，说不定，它也可以是整个蛋糕呢？

来自主题: AI技术研报

5926 点击 2025-06-11 14:58

为提升大模型“推理+搜索”能力，阿里通义实验室出手了。

来自主题: AI技术研报

8418 点击 2025-05-31 16:19

全球网友用闲置显卡组团训练大模型。40B大模型、20万亿token，创下了互联网上最大规模的预训练新纪录！去中心化AI的反攻，正式开始。OpenAI等巨头的算力霸权，这次真要凉了？

来自主题: AI资讯

5854 点击 2025-05-26 14:42

何恺明团队又一力作！这次他们带来的是「生成模型界的降维打击」——MeanFlow：无需预训练、无需蒸馏、不搞课程学习，仅一步函数评估（1-NFE），就能碾压以往的扩散与流模型！

来自主题: AI技术研报

6055 点击 2025-05-21 14:50

如今，C端产品已经淡出零一万物的业务版图，To B成为核心。

来自主题: AI资讯

6835 点击 2025-05-19 16:51

我们发现，当模型在测试阶段花更多时间思考时，其推理表现会显著提升，这打破了业界普遍依赖预训练算力的传统认知。

来自主题: AI资讯

8918 点击 2025-05-18 14:56

和人工标记数据说拜拜，利用预训练语言模型中的注意力机制就能选择可激发推理能力的训练数据！

来自主题: AI技术研报

7004 点击 2025-05-16 10:07