AI资讯新闻榜单内容搜索-模型训练

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 模型训练

DeepSeek R1 Zero中文复现教程来了！

DeepSeek R1 Zero中文复现教程来了！

DeepSeek R1 Zero中文复现教程来了！

各位同学好，我是来自 Unlock-DeepSeek 开源项目团队的骆师傅。先说结论，我们（Datawhale X 似然实验室）使用 3 张 A800(80G) 计算卡，花了 20 小时训练时间，做出了可能是国内首批 DeepSeek R1 Zero 的中文复现版本，我们把它叫做 Datawhale-R1，用于 R1 Zero 复现教学。

来自主题: AI技术研报

10075 点击 2025-02-07 17:54

DeepSeek用的GRPO占用大量内存？有人给出了些破解方法

DeepSeek用的GRPO占用大量内存？有人给出了些破解方法

DeepSeek用的GRPO占用大量内存？有人给出了些破解方法

自 DeepSeek-R1 发布以来，群组相对策略优化（GRPO）因其有效性和易于训练而成为大型语言模型强化学习的热门话题。R1 论文展示了如何使用 GRPO 从遵循 LLM（DeepSeek-v3）的基本指令转变为推理模型（DeepSeek-R1）。

来自主题: AI技术研报

7648 点击 2025-02-07 16:53

将集体学习引入树搜索，新方法CoMCTS实现o1-like的推理与反思

将集体学习引入树搜索，新方法CoMCTS实现o1-like的推理与反思

将集体学习引入树搜索，新方法CoMCTS实现o1-like的推理与反思

尽管多模态大语言模型（MLLM）在简单任务上最近取得了显著进展，但在复杂推理任务中表现仍然不佳。费曼的格言可能是这种现象的完美隐喻：只有掌握推理过程的每一步，才能真正解决问题。然而，当前的 MLLM 更擅长直接生成简短的最终答案，缺乏中间推理能力。本篇文章旨在开发一种通过学习创造推理过程中每个中间步骤直至最终答案的 MLLM，以实现问题的深入理解与解决。

来自主题: AI技术研报

7373 点击 2025-02-07 16:16

英伟达联手MIT清北发布SANA 1.5！线性扩散Transformer再刷文生图新SOTA

英伟达联手MIT清北发布SANA 1.5！线性扩散Transformer再刷文生图新SOTA

英伟达联手MIT清北发布SANA 1.5！线性扩散Transformer再刷文生图新SOTA

SANA 1.5是一种高效可扩展的线性扩散Transformer，针对文本生成图像任务进行了三项创新：高效的模型增长策略、深度剪枝和推理时扩展策略。这些创新不仅大幅降低了训练和推理成本，还在生成质量上达到了最先进的水平。

来自主题: AI技术研报

11825 点击 2025-02-07 16:05

被DeepSeek带火的知识蒸馏，开山之作曾被NeurIPS拒收，Hinton坐镇都没用

被DeepSeek带火的知识蒸馏，开山之作曾被NeurIPS拒收，Hinton坐镇都没用

被DeepSeek带火的知识蒸馏，开山之作曾被NeurIPS拒收，Hinton坐镇都没用

DeepSeek带火知识蒸馏，原作者现身爆料：原来一开始就不受待见。称得上是“蒸馏圣经”、由Hinton、Oriol Vinyals、Jeff Dean三位大佬合写的《Distilling the Knowledge in a Neural Network》，当年被NeurIPS 2014拒收。

来自主题: AI技术研报

7860 点击 2025-02-07 15:43

微软官宣All in智能体，SWE Agent首曝光！奥特曼预警2025编程巨变

微软官宣All in智能体，SWE Agent首曝光！奥特曼预警2025编程巨变

微软官宣All in智能体，SWE Agent首曝光！奥特曼预警2025编程巨变

2025年，软件工程要彻底变天了。先有奥特曼预言，后有微软下场All in智能体。刚刚，首个自主SWE智能体面世，不仅会主动改bug修复错误，还能自主提交PR评论。

来自主题: AI技术研报

7569 点击 2025-02-07 15:30

大模型会组合关系推理吗？打开黑盒，窥探Transformer脑回路

大模型会组合关系推理吗？打开黑盒，窥探Transformer脑回路

大模型会组合关系推理吗？打开黑盒，窥探Transformer脑回路

本文作者为北京邮电大学网络空间安全学院硕士研究生倪睿康，指导老师为肖达副教授。主要研究方向包括自然语言处理、模型可解释性。该工作为倪睿康在彩云科技实习期间完成。联系邮箱：ni@bupt.edu.cn, xiaoda99@bupt.edu.cn

来自主题: AI技术研报

5669 点击 2025-02-06 15:30

训练1000样本就能超越o1，李飞飞等人画出AI扩展新曲线

训练1000样本就能超越o1，李飞飞等人画出AI扩展新曲线

训练1000样本就能超越o1，李飞飞等人画出AI扩展新曲线

今年 1 月，DeepSeek R1 引爆了全球科技界，它创新的方法，大幅简化的算力需求撼动了英伟达万亿市值，更引发了全行业的反思。在通往 AGI（通用人工智能）的路上，我们现在不必一味扩大算力规模，更高效的新方法带来了更多的创新可能。

来自主题: AI技术研报

6548 点击 2025-02-05 13:46

o1开启LLM新范式，Ai2科学家解析背后秘籍：推理和强化学习是关键

o1开启LLM新范式，Ai2科学家解析背后秘籍：推理和强化学习是关键

o1开启LLM新范式，Ai2科学家解析背后秘籍：推理和强化学习是关键

关注NLP领域的人们，一定好奇「语言模型能做什么？」「什么是o1？」「为什么思维链有效？」

来自主题: AI技术研报

7600 点击 2025-02-04 20:15

OpenAI o3-mini被曝大量使用中文推理！全世界AI都要学中国话了？

OpenAI o3-mini被曝大量使用中文推理！全世界AI都要学中国话了？

OpenAI o3-mini被曝大量使用中文推理！全世界AI都要学中国话了？

这两天，国外网友纷纷发现o3-mini-high在思考过程中居然会经常出现中文！难道真如网友猜测，是借鉴DeepSeek了？

来自主题: AI资讯

9182 点击 2025-02-04 17:12

上一页当前第268页,共384页下一页