AI资讯新闻榜单内容搜索-训练数据

字节Seed团队发布循环语言模型Ouro，在预训练阶段直接「思考」，Bengio组参与

现代 LLM 通常依赖显式的文本生成过程（例如「思维链」）来进行「思考」训练。这种策略将推理任务推迟到训练后的阶段，未能充分挖掘预训练数据中的潜力。

来自主题: AI技术研报

9888 点击 2025-11-04 16:12

字节发布通用游戏智能体！5000亿token训练，用鼠标键盘吊打GPT-5！

Game-TARS基于统一、可扩展的键盘—鼠标动作空间训练，可在操作系统、网页与模拟环境中进行大规模预训练。依托超5000亿标注量级的多模态训练数据，结合稀疏推理（Sparse-Thinking）与衰减持续损失（decaying continual loss），大幅提升了智能体的可扩展性和泛化性。

来自主题: AI技术研报

9048 点击 2025-11-01 09:42

干家务一小时挣1000元，具身智能时代人类新岗位

注意看，眼前这个男人暂且叫他小帅。你可能想不到，他只是在厨房里优雅地煎牛排做做家务，每小时最高能赚进1000多块（150美元）。怪不得小帅天天上班喜笑颜开。

来自主题: AI资讯

9733 点击 2025-10-25 10:56

管你模型多大，250份有毒文档统统放倒，Anthropic：迄今为止规模最大的大模型数据投毒调查

本次新研究是迄今为止规模最大的大模型数据投毒调查。Anthropic 与英国人工智能安全研究所（UK AI Security Institute）和艾伦・图灵研究所（Alan Turing Institute）联合进行的一项研究彻底打破了这一传统观念：只需 250 份恶意文档就可能在大型语言模型中制造出「后门」漏洞，且这一结论与模型规模或训练数据量无关。

来自主题: AI技术研报

10129 点击 2025-10-10 12:14

EMNLP 2025 | CARE：无需外部工具，让大模型原生检索增强推理实现上下文高保真

近日，来自 MetaGPT、蒙特利尔大学和 Mila 研究所、麦吉尔大学、耶鲁大学等机构的研究团队发布 CARE 框架，一个新颖的原生检索增强推理框架，教会 LLM 将推理过程中的上下文事实与模型自身的检索能力有机结合起来。该框架现已全面开源，包括训练数据集、训练代码、模型 checkpoints 和评估代码，为社区提供一套完整的、可复现工作。

来自主题: AI技术研报

8748 点击 2025-10-07 22:10