AI资讯新闻榜单内容搜索-BERT

Anthropic自曝下一代Claude训练内幕！有人专职研究「性格」

Claude 100%编码Claude，这在圈内早已不是秘密。但Claude「自我造物」全过程，始终是Anthropic严防死守的核心机密。就在今天，Anthropic产品负责人Alex Albert在一场35分钟的访谈中，首次毫无保留地曝光了全细节！

来自主题: AI资讯

8902 点击 2026-05-23 11:16

Roblox 的AI能实时生成任何游戏场景，但玩了才发现根本没有目标

01 那个问题 ::: 什么是游戏？这个问题比听起来要难。画面逼真不算，操控流畅不算，连开放世界都不算——你还需要有目标，有规则，有「我死了」和「我赢了」的判断。 Alberto Hojel 在 X

来自主题: AI资讯

9459 点击 2026-05-23 10:15

LLM助力突破尘封60年数学猜想！北大王立威团队大幅刷新斯坦纳比下界

近期，LLM 已经在 IMO 上取得了很好的成绩，在一些研究级数学上（如短程证明、组合构造）也有所进展。但如果真正让 LLM 去处理提出数十年的数学猜想，结果会是如何？

来自主题: AI技术研报

5707 点击 2026-05-18 15:29

所有实验室都怕字节，所有人都在夸DeepSeek！美国研究员36小时中国AI行

中国AI研究员的性格、魅力和真诚……让人倍感亲切。这是艾伦研究所（Ai2）的研究员Nathan Lambert，在最近结束中国之行后，发自内心的一番感慨。在Nathan眼里，国内的LLM圈子简直是天堂，大家彼此尊重、即便立场不同也客客气气的。

来自主题: AI资讯

9667 点击 2026-05-08 14:07

ATOM Report：中国开源模型已经全面领先，而且差距还在扩大

2026 年 4 月，Nathan Lambert 和 Florian Brand 发布了 The ATOM Report，一份关于开源语言模型生态的综合采纳度快照。这份报告追踪了约 1500 个主线开源模型的下载量、衍生模型、推理市场份额和性能数据，覆盖 2023 年 11 月到 2026 年 3 月

来自主题: AI资讯

9676 点击 2026-04-09 14:47

通用的dLLM开发框架，让BERT掌握扩散式对话

扩散式语言模型（Diffusion Language Model, DLM）虽近期受关注，但社区长期受限于（1）缺乏易用开发框架与（2）高昂训练成本，导致多数 DLM 难以在合理预算下复现，初学者也难以真正理解其训练与生成机制。

来自主题: AI技术研报

9074 点击 2025-11-24 10:19

扩散不死，BERT永生！Karpathy凌晨反思：自回归时代该终结了?

谷歌遗珠与IBM预言：一文点醒Karpathy，扩散模型或成LLM下一步。

来自主题: AI技术研报

10712 点击 2025-11-05 16:41

Embedding黑箱成为历史！这个新框架让模型“先解释，再学Embedding”

让模型先解释，再学Embedding！来自UIUC、ANU、港科大、UW、TAMU等多所高校的研究人员，最新推出可解释的生成式Embedding框架——GRACE。过去几年，文本表征（Text Embedding）模型经历了从BERT到E5、GTE、LLM2Vec，Qwen-Embedding等不断演进的浪潮。这些模型将文本映射为向量空间，用于语义检索、聚类、问答匹配等任务。

来自主题: AI技术研报

8547 点击 2025-10-22 15:00

Murati翁荔陈丹琦公司发布首个产品，让大模型微调门槛暴降，要重新发明一个OpenAI

Thinking Machines Lab发布首个产品：Thinker，让模型微调变得像改Python代码一样简单。也算是终于摘掉了“0产品0收入估值840亿”的帽子。Tinker受到了业界的密切关注。AI基础设施公司Anyscale的CEO Robert Nishihara等beta测试者表示，尽管市面上有其他微调工具，但Tinker在“抽象化和可调性之间取得了卓越的平衡”

来自主题: AI资讯

10962 点击 2025-10-03 11:53

KDD 2025 Best Paper Runner-Up | EI-BERT：超紧凑语言模型压缩框架

在移动计算时代，将高效的自然语言处理模型部署到资源受限的边缘设备上面临巨大挑战。这些场景通常要求严格的隐私合规、实时响应能力和多任务处理功能。

来自主题: AI技术研报

8751 点击 2025-08-23 11:47