AI资讯新闻榜单内容搜索-推理模型

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 推理模型

绝对零监督Absolute Zero：类AlphaZero自博弈赋能大模型推理，全新零数据训练范式问世

绝对零监督Absolute Zero：类AlphaZero自博弈赋能大模型推理，全新零数据训练范式问世

绝对零监督Absolute Zero：类AlphaZero自博弈赋能大模型推理，全新零数据训练范式问世

在人工智能领域，推理能力的进化已成为通向通用智能的核心挑战。近期，Reinforcement Learning with Verifiable Rewards（RLVR）范式下涌现出一批「Zero」类推理模型，摆脱了对人类显式推理示范的依赖，通过强化学习过程自我学习推理轨迹，显著减少了监督训练所需的人力成本。

来自主题: AI技术研报

9322 点击 2025-05-08 14:49

VDC+VBench双榜第一！强化学习打磨的国产视频大模型，超越Sora、Pika

VDC+VBench双榜第一！强化学习打磨的国产视频大模型，超越Sora、Pika

VDC+VBench双榜第一！强化学习打磨的国产视频大模型，超越Sora、Pika

随着 Deepseek 等强推理模型的成功，强化学习在大语言模型训练中越来越重要，但在视频生成领域缺少探索。复旦大学等机构将强化学习引入到视频生成领域，经过强化学习优化的视频生成模型，生成效果更加自然流畅，更加合理。并且分别在 VDC（Video Detailed Captioning）[1] 和 VBench [2] 两大国际权威榜单中斩获第一。

来自主题: AI技术研报

10965 点击 2025-05-06 15:07

Sebastian Raschka 新书《从头开始推理》抢先看，揭秘推理模型基础

Sebastian Raschka 新书《从头开始推理》抢先看，揭秘推理模型基础

Sebastian Raschka 新书《从头开始推理》抢先看，揭秘推理模型基础

推理模型发展正盛，著名 AI 技术博主 Sebastian Raschka 也正在写一本关于推理模型工作方式的新书《Reasoning From Scratch》。

来自主题: AI技术研报

9161 点击 2025-05-06 13:58

不要思考过程，推理模型能力能够更强丨UC伯克利等最新研究

不要思考过程，推理模型能力能够更强丨UC伯克利等最新研究

不要思考过程，推理模型能力能够更强丨UC伯克利等最新研究

其实……不用大段大段思考，推理模型也能有效推理！

来自主题: AI技术研报

8005 点击 2025-05-02 13:49

深夜突袭，阿里Qwen3登顶全球开源王座！暴击DeepSeek-R1，2小时狂揽17k星

深夜突袭，阿里Qwen3登顶全球开源王座！暴击DeepSeek-R1，2小时狂揽17k星

深夜突袭，阿里Qwen3登顶全球开源王座！暴击DeepSeek-R1，2小时狂揽17k星

阿里Qwen3凌晨开源，正式登顶全球开源大模型王座！它的性能全面超越DeepSeek-R1和OpenAI o1，采用MoE架构，总参数235B，横扫各大基准。这次开源的Qwen3家族，8款混合推理模型全部开源，免费商用。

来自主题: AI资讯

11655 点击 2025-04-29 08:49

全球开发者组团训练，首个异步强化学习32B推理模型震撼来袭！数据已开源

全球开发者组团训练，首个异步强化学习32B推理模型震撼来袭！数据已开源

全球开发者组团训练，首个异步强化学习32B推理模型震撼来袭！数据已开源

全球首个去中心化强化学习训练的32B模型——INTELLECT-2震撼发布！无需授权，就能用自家异构计算资源参与其中，让编码、数学与科学领域的推理性能迈向新高度。

来自主题: AI资讯

11104 点击 2025-04-27 09:38

具身交互推理: 图像-思考-行动交织思维链让机器人会思考、会交互

具身交互推理: 图像-思考-行动交织思维链让机器人会思考、会交互

具身交互推理: 图像-思考-行动交织思维链让机器人会思考、会交互

OpenAI 的 o1 系列模型、Deepseek-R1 带起了推理模型的研究热潮，但这些推理模型大多关注数学、代码等专业领域。

来自主题: AI技术研报

7926 点击 2025-04-26 15:31

TTS和TTT已过时？TTRL横空出世，推理模型摆脱「标注数据」依赖，性能暴涨

TTS和TTT已过时？TTRL横空出世，推理模型摆脱「标注数据」依赖，性能暴涨

TTS和TTT已过时？TTRL横空出世，推理模型摆脱「标注数据」依赖，性能暴涨

在大语言模型（LLMs）竞争日趋白热化的今天，「推理能力」已成为评判模型优劣的关键指标。

来自主题: AI技术研报

8841 点击 2025-04-24 14:29

142页长文揭秘DeepSeek-R1「思维大脑」！开启全新「思维链学」研究

142页长文揭秘DeepSeek-R1「思维大脑」！开启全新「思维链学」研究

142页长文揭秘DeepSeek-R1「思维大脑」！开启全新「思维链学」研究

DeepSeek-R1是近年来推理模型领域的一颗新星，它不仅突破了传统LLM的局限，还开启了全新的研究方向「思维链学」（Thoughtology）。这份长达142页的报告深入剖析了DeepSeek-R1的推理过程，揭示了其推理链的独特结构与优势，为未来推理模型的优化提供了重要启示。

来自主题: AI技术研报

9912 点击 2025-04-22 18:59

英伟达H20不让用？全国产算力深度推理模型讯飞星火X1升级，4张华为910B即可部署满血版

英伟达H20不让用？全国产算力深度推理模型讯飞星火X1升级，4张华为910B即可部署满血版

英伟达H20不让用？全国产算力深度推理模型讯飞星火X1升级，4张华为910B即可部署满血版

英伟达H20也不能用了。中国大模型还能好吗？

来自主题: AI资讯

9695 点击 2025-04-22 17:48

上一页当前第10页,共22页下一页