AI资讯新闻榜单内容搜索-推理模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 推理模型
DeepSeek技术解析:如何冲击英伟达两大壁垒?

DeepSeek技术解析:如何冲击英伟达两大壁垒?

DeepSeek技术解析:如何冲击英伟达两大壁垒?

DeepSeek的V3模型仅用557.6万的训练成本,实现了与OpenAI O1推理模型相近的性能,这在全球范围内引发连锁反应。由于不用那么先进的英伟达芯片就能实现AI能力的飞跃,英伟达在1月27日一天跌幅高达17%,市值一度蒸发6000亿美元。

来自主题: AI资讯
5806 点击    2025-02-08 12:09
李飞飞团队50美元复刻DeepSeek?其实是基于通义监督微调,我们研究了论文

李飞飞团队50美元复刻DeepSeek?其实是基于通义监督微调,我们研究了论文

李飞飞团队50美元复刻DeepSeek?其实是基于通义监督微调,我们研究了论文

近日有媒体报道称,李飞飞等斯坦福大学和华盛顿大学的研究人员以不到50美元的云计算费用,成功训练出了一个名为s1的人工智能推理模型。

来自主题: AI资讯
5995 点击    2025-02-07 19:31
DeepSeek用的GRPO占用大量内存?有人给出了些破解方法

DeepSeek用的GRPO占用大量内存?有人给出了些破解方法

DeepSeek用的GRPO占用大量内存?有人给出了些破解方法

自 DeepSeek-R1 发布以来,群组相对策略优化(GRPO)因其有效性和易于训练而成为大型语言模型强化学习的热门话题。R1 论文展示了如何使用 GRPO 从遵循 LLM(DeepSeek-v3)的基本指令转变为推理模型(DeepSeek-R1)。

来自主题: AI技术研报
5810 点击    2025-02-07 16:53
成本不到150元!李飞飞等26分钟训出个推理模型,媲美o1和R1,秘诀:用蒸馏

成本不到150元!李飞飞等26分钟训出个推理模型,媲美o1和R1,秘诀:用蒸馏

成本不到150元!李飞飞等26分钟训出个推理模型,媲美o1和R1,秘诀:用蒸馏

成本不到150元,训练出一个媲美DeepSeek-R1和OpenAI o1的推理模型?!这不是洋葱新闻,而是AI教母李飞飞、斯坦福大学、华盛顿大学、艾伦人工智能实验室等携手推出的最新杰作:s1。

来自主题: AI资讯
7945 点击    2025-02-07 00:26
冲击DeepSeek R1,谷歌发布新一代Gemini全型号刷榜,编程、物理模拟能力炸裂

冲击DeepSeek R1,谷歌发布新一代Gemini全型号刷榜,编程、物理模拟能力炸裂

冲击DeepSeek R1,谷歌发布新一代Gemini全型号刷榜,编程、物理模拟能力炸裂

本周三,该公司全面发布 Gemini 2.0 Flash、 Gemini 2.0 Flash-Lite 以及新一代旗舰大模型 Gemini 2.0 Pro 实验版本,并且还在 Gemini App 中推出了其推理模型 Gemini 2.0 Flash Thinking。

来自主题: AI资讯
8990 点击    2025-02-06 15:13
DeepSeek的节后效应,国产AI生态加速闭环

DeepSeek的节后效应,国产AI生态加速闭环

DeepSeek的节后效应,国产AI生态加速闭环

DeepSeek不主动追求旗下大模型的商业化,但它的推理模型R1的发布,却推动了全球整个大模型生态的商业化进程,也加速了国产AI生态的闭环。

来自主题: AI资讯
5984 点击    2025-02-05 16:24
服务崩溃,DeepSeek该给金主一个贴金的机会

服务崩溃,DeepSeek该给金主一个贴金的机会

服务崩溃,DeepSeek该给金主一个贴金的机会

2月1日,就在OpenAI上新o3-mini推理模型同时,DeepSeek深度思考和联网搜索功能被爆暂时停止服务。一天之后,经字母榜实测,目前DeepSeek深度思考服务已恢复正常,但联网搜索仍提示“由于技术原因,暂不可用”。

来自主题: AI资讯
7973 点击    2025-02-04 12:55
首个OpenAI免费推理模型o3-mini发布!DeepSeek让奥特曼反思:不开源我们错了

首个OpenAI免费推理模型o3-mini发布!DeepSeek让奥特曼反思:不开源我们错了

首个OpenAI免费推理模型o3-mini发布!DeepSeek让奥特曼反思:不开源我们错了

就在刚刚,OpenAI深夜紧急发布了最新推理模型,o3-mini系列。一共包含三个版本:low、medium和high。其中o3-mini和o3-mini-high已经上线:

来自主题: AI资讯
9202 点击    2025-02-01 12:39
AI“硬控”拜年

AI“硬控”拜年

AI“硬控”拜年

这个春节,国产AI引发全球轰动,一家叫做DeepSeek的初创科技公司发布了一款推理模型,不仅能力不输OpenAI的o1,训练成本也远低于国外,各行各业更是跟风尝试。1月27日,DeepSeek超过ChatGPT,成为苹果商店美国区免费应用榜单第一,也登顶中国区免费榜,由于用户突然涌入太多,还出现了短暂宕机。

来自主题: AI资讯
6673 点击    2025-01-30 12:46