AI资讯新闻榜单内容搜索-RL

速递｜德国AI客服独角兽Parloa估值半年翻倍，冲刺20-30亿美元，拟融资2亿美元

据知情人士透露，开发客户服务人工智能的德国初创公司Parloa正在寻求新一轮融资，估值将较今年5月大幅提升。这家在德国和纽约设有办公室的公司，已与包括General Catalyst在内的投资者进行了洽谈，寻求筹集约2亿美元的新资金。知情人士称，Parloa正在讨论的潜在估值区间约为20亿至30亿美元。

来自主题: AI资讯

7958 点击 2025-12-08 11:52

LLM强化学习不稳定之谜，被Qwen团队从「一阶近似」视角解开

如今，强化学习（RL）已成为提升大语言模型（LLM）复杂推理与解题能力的关键技术范式，而稳定的训练过程对于成功扩展 RL 至关重要。由于语言具有强烈的上下文属性，LLM 的 RL 通常依赖序列级奖励 —— 即根据完整生成序列给一个标量分数。

来自主题: AI技术研报

5637 点击 2025-12-08 10:27

他们让万亿参数RL学会了「省着跑」，顺便砍掉九成算力

2025年，AI大模型的竞争焦点正在发生根本性转移。

来自主题: AI技术研报

7662 点击 2025-12-08 08:57

告别「2D错觉」，SpatialActor通过解耦语义与几何，为具身智能注入强鲁棒空间基因

作者在包含 50 多个任务的多个仿真和真实世界场景中评估了 SpatialActor。它在 RLBench 上取得了 87.4% 的成绩，达到 SOTA 水平；在不同噪声条件下，性能提升了 13.9% 至 19.4%，展现出强大的鲁棒性。目前该论文已被收录为 AAAI 2026 Oral，并将于近期开源。

来自主题: AI技术研报

7601 点击 2025-12-06 10:59