AI资讯新闻榜单内容搜索-大模型

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 大模型

名师一定出高徒？清华团队最新揭秘：别再迷信大模型蒸馏的「免费午餐」

名师一定出高徒？清华团队最新揭秘：别再迷信大模型蒸馏的「免费午餐」

名师一定出高徒？清华团队最新揭秘：别再迷信大模型蒸馏的「免费午餐」

当下的大模型后训练（Post-training）pipeline 中，On-Policy Distillation（OPD）已经成为了明星技术。从 Qwen3、MiMo 到 GLM-5，业界纷纷采用 OPD 并报告了巨大的性能提升。相比于强化学习（RL）稀疏的结果奖励，OPD 提供了密集的 Token 级别监督信号，看起来就像是一顿「免费的午餐」。

来自主题: AI技术研报

10070 点击 2026-05-14 09:59

ICML 2026 | 将多教师冲突转化为动态约束，破解多模态大模型推理对齐难题

ICML 2026 | 将多教师冲突转化为动态约束，破解多模态大模型推理对齐难题

ICML 2026 | 将多教师冲突转化为动态约束，破解多模态大模型推理对齐难题

在多模态大模型（MLLM）快速发展的浪潮中，融合多模型 “集体智慧” 已成为提升模型性能的关键路径，并催生了多教师知识蒸馏这一主流范式。然而，不同来源的教师模型在架构与优化上的差异，其在相似推理过程中呈现出不稳定甚至偏移的认知轨迹，即 “概念漂移”（Concept Drift）。

来自主题: AI技术研报

8067 点击 2026-05-14 09:30

智谱首破5000亿！六小虎与DeepSeek千亿估值竞赛，谁的拳头最硬？

智谱首破5000亿！六小虎与DeepSeek千亿估值竞赛，谁的拳头最硬？

智谱首破5000亿！六小虎与DeepSeek千亿估值竞赛，谁的拳头最硬？

5000亿门槛前，中国大模型谁最像真巨头？

来自主题: AI资讯

8759 点击 2026-05-14 09:30

3080亿！黄仁勋今年砸向AI的钱，快够买一个DeepSeek了

3080亿！黄仁勋今年砸向AI的钱，快够买一个DeepSeek了

3080亿！黄仁勋今年砸向AI的钱，快够买一个DeepSeek了

押注AI基础设施、新云和大模型。

来自主题: AI资讯

8730 点击 2026-05-14 09:29

林俊旸创业，新公司估值约20亿美金丨智能涌现独家

林俊旸创业，新公司估值约20亿美金丨智能涌现独家

林俊旸创业，新公司估值约20亿美金丨智能涌现独家

独家获悉，前阿里千问大模型技术负责人林俊旸近期已经开启创业，考虑方向包括世界模型和具身大脑。目前，林俊旸已经招募数名字节、腾讯和海外背景的成员，并以约20亿美金的估值开启融资，接触基金包括红杉中国、高榕创投等。

来自主题: AI资讯

8688 点击 2026-05-13 16:47

爱思唯尔把Meta告了：拿Sci-Hub盗版论文训练大模型

爱思唯尔把Meta告了：拿Sci-Hub盗版论文训练大模型

爱思唯尔把Meta告了：拿Sci-Hub盗版论文训练大模型

AI版权大战，再度升级了。

来自主题: AI资讯

7248 点击 2026-05-13 15:23

ICML 2026 Spotlight| 拒绝盲目猜token，阿里x浙大将投机解码带入弹性预算时代

ICML 2026 Spotlight| 拒绝盲目猜token，阿里x浙大将投机解码带入弹性预算时代

ICML 2026 Spotlight| 拒绝盲目猜token，阿里x浙大将投机解码带入弹性预算时代

随着大模型参数规模持续扩大，推理成本已经成为生产级 LLM 服务的核心瓶颈。投机解码（Speculative Decoding, SD）通过「小模型 draft + 大模型 verify」的方式，将多个候选 token 放到一次目标模型前向中并行验证，从而缓解自回归解码的串行瓶颈。

来自主题: AI技术研报

8456 点击 2026-05-13 15:01

性能碾压谷歌！5000亿美元巨头开源最强端侧医疗AI，背后藏着一家中国企业！

性能碾压谷歌！5000亿美元巨头开源最强端侧医疗AI，背后藏着一家中国企业！

性能碾压谷歌！5000亿美元巨头开源最强端侧医疗AI，背后藏着一家中国企业！

一家估值超5000亿美元的币圈富豪公司，秀出了性能碾压谷歌的AI医疗大模型。

来自主题: AI资讯

7259 点击 2026-05-13 10:48

谷歌首度证实：黑客已开始用AI发动真实网络攻击！

谷歌首度证实：黑客已开始用AI发动真实网络攻击！

谷歌首度证实：黑客已开始用AI发动真实网络攻击！

谷歌周一发布报告，首次确认犯罪黑客使用AI大模型发现了一个此前未知的零日漏洞，并差点发动大规模攻击。这件事之所以炸裂，是因为安全界担心了好几年的「AI自动挖洞」，终于从理论变成了现实。而在Anthropic的Mythos模型已经找到数千个零日漏洞的背景下，这可能只是冰山一角。

来自主题: AI资讯

7456 点击 2026-05-13 10:26

上海AI Lab新研究：SFT能泛化，只要满足这三个条件

上海AI Lab新研究：SFT能泛化，只要满足这三个条件

上海AI Lab新研究：SFT能泛化，只要满足这三个条件

随着大模型后训练（Post-training）技术的发展，强化学习（RL）在提升模型推理能力方面的表现备受瞩目。

来自主题: AI技术研报

9399 点击 2026-05-13 09:59

上一页当前第18页,共538页下一页