AI资讯新闻榜单内容搜索-AlphaZero

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: AlphaZero

华人一作！Meta等复刻AlphaZero神话，AI甩开人类自修成神

华人一作！Meta等复刻AlphaZero神话，AI甩开人类自修成神

华人一作！Meta等复刻AlphaZero神话，AI甩开人类自修成神

当模型学会「左右互搏」的那一刻，平庸的模仿时代结束了，真正的硅基编程奇迹刚刚开始。

来自主题: AI技术研报

10616 点击 2025-12-29 09:06

绝对零监督Absolute Zero：类AlphaZero自博弈赋能大模型推理，全新零数据训练范式问世

绝对零监督Absolute Zero：类AlphaZero自博弈赋能大模型推理，全新零数据训练范式问世

绝对零监督Absolute Zero：类AlphaZero自博弈赋能大模型推理，全新零数据训练范式问世

在人工智能领域，推理能力的进化已成为通向通用智能的核心挑战。近期，Reinforcement Learning with Verifiable Rewards（RLVR）范式下涌现出一批「Zero」类推理模型，摆脱了对人类显式推理示范的依赖，通过强化学习过程自我学习推理轨迹，显著减少了监督训练所需的人力成本。

来自主题: AI技术研报

9288 点击 2025-05-08 14:49

魔改AlphaZero后，《我的世界》AI老玩家问世，干活不用下指令

魔改AlphaZero后，《我的世界》AI老玩家问世，干活不用下指令

魔改AlphaZero后，《我的世界》AI老玩家问世，干活不用下指令

人和智能体共享奖励参数，这才是强化学习正确的方向？

来自主题: AI技术研报

9020 点击 2025-04-12 21:59

对话Google DeepMind资深科学家：强化学习是重点，大模型时代AlphaZero依然重要

对话Google DeepMind资深科学家：强化学习是重点，大模型时代AlphaZero依然重要

对话Google DeepMind资深科学家：强化学习是重点，大模型时代AlphaZero依然重要

如果说有一类游戏贯穿AI发展的始终，围绕其诞生的Thinking Game至今仍影响着最前沿AI技术的发展，那么答案很显然：棋类游戏。

来自主题: AI资讯

8921 点击 2024-12-05 20:13

Anthropic挖走DeepMind强化学习大牛、AlphaGo核心作者Julian Schrittwieser

Anthropic挖走DeepMind强化学习大牛、AlphaGo核心作者Julian Schrittwieser

Anthropic挖走DeepMind强化学习大牛、AlphaGo核心作者Julian Schrittwieser

从 AlphaGo、AlphaZero 、MuZero 到 AlphaCode、AlphaTensor，再到最近的 Gemini 和 AlphaProof，Julian Schrittwieser 的工作成果似乎比他的名字更广为人知。

来自主题: AI资讯

9750 点击 2024-10-29 18:00

碾压人类的超级AI，赞助棋界巅峰大赛了

碾压人类的超级AI，赞助棋界巅峰大赛了

碾压人类的超级AI，赞助棋界巅峰大赛了

在陈思诚导演、上映一个多月便揽下3亿票房的谍战片《解密》中，主人公容金珍是一位民国时期的数学天才，大学毕业后本已开始从事“机器人脑”的研究工作，却在机缘巧合之下被谍报机关招募，自此一生奉献给了密码破译。

来自主题: AI资讯

10196 点击 2024-09-26 11:00

上一页当前第1页,共1页下一页