AI资讯新闻榜单内容搜索-模型

大型语言模型稳定强化学习的新路径：几何平均策略优化GMPO

近年来，强化学习（RL）在大型语言模型（LLM）的微调过程中，尤其是在推理能力提升方面，取得了显著的成效。传统的强化学习方法，如近端策略优化（Proximal Policy Optimization，PPO）及其变种，包括组相对策略优化（Group Relative Policy Optimization，GRPO），在处理复杂推理任务时表现出了强大的潜力。

来自主题: AI技术研报

5945 点击 2025-08-13 16:03

刚刚，商汤内部两万字复盘曝光：多模态通往AGI核心路线首次公开

时间是最好的试金石，AI领域尤其如此。当行业热议大模型走向时，商汤早已锚定「多模态通用智能」——这是商汤以深厚研究积累和实践反复验证的可行路径。今天，商汤科技联合创始人、执行董事、首席科学家林达华特别撰写的万字深度长文正式发布。文章剖析了商汤为何将「多模态通用智能」视为技术战略的核心引擎，也探索性阐释了在组织及战略层面的诸多思考。通往AGI的拼图中，多模态是缺一不可的基石。

来自主题: AI资讯

7109 点击 2025-08-13 13:26

速递｜韩企Datumo获Salesforce投资1550万美金，无代码AI模型评估挑战Scale AI

总部位于首尔的 Datumo 最初是一家 AI 数据标注公司，如今致力于通过提供工具和数据来帮助企业构建更安全的 AI 系统。

来自主题: AI资讯

7672 点击 2025-08-13 13:02

GPT-5 不是技术新范式，是 OpenAI 加速产品化的战略拐点

GPT-5是一次 ChatGPT 产品的重要升级。Routing 能力的加入帮助 ChatGPT 模型第一次把产品线捋顺统一，是 UX 交互的一次重要革新。就像 Apple 决定只推出一款 iPhone 产品线，短期用户可能被迫适应 GPT-5 这个旗舰产品的优缺点，但长期更容易占领用户心智。

来自主题: AI资讯

6527 点击 2025-08-13 12:53

腾讯AI Lab|让AI左右互搏，无需人类数据也能自学成才！

当前训练强大的大语言模型（LLM），就像是培养一个顶尖运动员，需要大量的、由专家（人类标注员）精心设计的训练计划和教材（高质量的标注数据）。

来自主题: AI资讯

7339 点击 2025-08-13 11:55

深度｜当AI创业进入深水区，谁在为AI新势力提供“确定性”？

2024年，AI创业的叙事正在发生根本性转变。如果说2023年是“百模大战”的技术奇观与资本狂欢，那么今年，当市场的喧嚣逐渐沉淀，聚光灯则明确地打向了产业落地的主战场。一批真正意义上的“AI原生”新势力正在快速崛起，它们不再是传统业务的AI改良派，而是将大模型作为数字世界的地基，直接构建商业大厦的“原住民”。

来自主题: AI资讯

7469 点击 2025-08-13 11:38