AI资讯新闻榜单内容搜索-推理大模型

人大刘勇团队「慢思考」机理分析：从雪球误差到正确推理概率

「慢思考」（Slow-Thinking），也被称为测试时扩展（Test-Time Scaling），成为提升 LLM 推理能力的新方向。近年来，OpenAI 的 o1 [4]、DeepSeek 的 R1 [5] 以及 Qwen 的 QwQ [6] 等顶尖推理大模型的发布，进一步印证了推理过程的扩展是优化 LLM 逻辑能力的有效路径。

来自主题: AI技术研报

6733 点击 2025-02-10 17:04

图像生成推理大模型，港中文北大等联手破解画质提升难题

图像生成模型，也用上思维链（CoT）了！此外，作者还提出了两种专门针对该任务的新型奖励模型——潜力评估奖励模型。（Potential Assessment Reward Model，PARM）及其增强版本PARM++。

来自主题: AI技术研报

6992 点击 2025-02-10 11:09

DeepSeek又被攻击，本地化部署是否安全？

在今年春节期间，最近国产的推理大模型DeepSeek R1很火，我们经过实测，推理效果非常棒，可以说是阶段性的技术突破。

来自主题: AI资讯

7732 点击 2025-02-05 12:04

最懂医疗的国产推理大模型，果然来自百川智能

就在本周，Kimi 的新模型打开了强化学习 Scaling 新范式，DeepSeek R1 用开源的方式「接班了 OpenAI」，谷歌则把 Gemini 2.0 Flash Thinking 的上下文长度延伸到了 1M。1 月 24 日上午，百川智能重磅发布了国内首个全场景深度思考模型，把这一轮军备竞赛推向了高潮。

来自主题: AI资讯

8158 点击 2025-01-26 12:16