AI资讯新闻榜单内容搜索-模型训练

RL是「点金石」还是「挖掘机」？CMU 用可控实验给出答案

近期，强化学习（RL）技术在提升语言模型的推理能力方面取得了显著成效。

来自主题: AI技术研报

6700 点击 2025-12-16 16:26

Veo何止生成视频：DeepMind正在用它模拟整个机器人世界

随着通用型（Generalist）机器人策略的发展，机器人能够通过自然语言指令在多种环境中完成各类任务，但这也带来了显著的挑战。

来自主题: AI技术研报

10338 点击 2025-12-16 14:39

阿里妈妈发布MUSE：用多模态搞定十万级超长行为序列，并开源Taobao-MM数据集

如果把用户在互联网上留下的每一个足迹都看作一段记忆，那么现在的推荐系统大多患有 “短期健忘症”。

来自主题: AI技术研报

9666 点击 2025-12-16 14:38

推特吵架吵出篇论文！谢赛宁团队新作iREPA只要3行代码

要说真学术，还得看推特。

来自主题: AI技术研报

6656 点击 2025-12-16 14:37

1100多个模型殊途同归，指向一个「通用子空间」，柏拉图又赢一回？

模型架构的重要性可能远超我们之前的认知。

来自主题: AI技术研报

8747 点击 2025-12-16 14:36

全网破防，AI「手指难题」翻车逼疯人类！6根手指，暴露Transformer致命缺陷

最近，网友们已经被AI「手指难题」逼疯了。给AI一支六指手，它始终无法正确数出到底有几根手指！说吧AI，你是不是在嘲笑人类？其实这背后，暗藏着Transformer架构的「阿喀琉斯之踵」……

来自主题: AI技术研报

6860 点击 2025-12-16 10:37

Prompt、Context engineering 又向前进化了，3个关键维度+5个具体杠杆｜谷歌

我们正处在一个AI Agent（智能体）爆发的时代。从简单的ReAct循环到复杂的Multi-Agent Swarm（多智能体蜂群），新的架构层出不穷。但在这些眼花缭乱的名词背后，开发者的工作往往更像是一门“玄学”，我们凭直觉调整提示词，凭经验增加Agent的数量，却很难说清楚为什么某个架构在特定任务上表现更好。

来自主题: AI技术研报

8606 点击 2025-12-16 09:59