AI资讯新闻榜单内容搜索-小模型

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 小模型

只花9美元，推理能力暴涨20%！小模型Tina震撼登场，成本缩减260倍

只花9美元，推理能力暴涨20%！小模型Tina震撼登场，成本缩减260倍

只花9美元，推理能力暴涨20%！小模型Tina震撼登场，成本缩减260倍

在人工智能领域，语言模型的发展日新月异，推理能力作为语言模型的核心竞争力之一，一直是研究的焦点，许多的 AI 前沿人才对 AI 推理的效率进行研究。

来自主题: AI技术研报

8234 点击 2025-04-30 18:40

英伟达AI奥赛夺冠，1.5B数学碾压DeepSeek-R1！代码全系开源，陶哲轩点赞

英伟达AI奥赛夺冠，1.5B数学碾压DeepSeek-R1！代码全系开源，陶哲轩点赞

英伟达AI奥赛夺冠，1.5B数学碾压DeepSeek-R1！代码全系开源，陶哲轩点赞

AIMO2冠军「答卷」公布了！英伟达团队NemoSkills拔得头筹，开源了OpenMath-Nemotron系列AI模型，1.5B小模型击败14B-DeepSeek「推理大模型」！

来自主题: AI技术研报

6021 点击 2025-04-26 17:17

过程奖励模型也可以测试时扩展？清华、上海AI Lab 23K数据让1.5B小模型逆袭GPT-4o

过程奖励模型也可以测试时扩展？清华、上海AI Lab 23K数据让1.5B小模型逆袭GPT-4o

过程奖励模型也可以测试时扩展？清华、上海AI Lab 23K数据让1.5B小模型逆袭GPT-4o

随着 OpenAI o1 和 DeepSeek R1 的爆火，大语言模型（LLM）的推理能力增强和测试时扩展（TTS）受到广泛关注。然而，在复杂推理问题中，如何精准评估模型每一步回答的质量，仍然是一个亟待解决的难题。传统的过程奖励模型（PRM）虽能验证推理步骤，但受限于标量评分机制，难以捕捉深层逻辑错误，且其判别式建模方式限制了测试时的拓展能力。

来自主题: AI技术研报

7132 点击 2025-04-14 14:39

AI奥数大奖出炉，英伟达摘桂冠！14B破解34题暴击DeepSeek R1

AI奥数大奖出炉，英伟达摘桂冠！14B破解34题暴击DeepSeek R1

AI奥数大奖出炉，英伟达摘桂冠！14B破解34题暴击DeepSeek R1

AIMO2最终结果出炉了！英伟达团队NemoSkills拔得头筹，凭借14B小模型破解了34道奥数题，完胜DeepSeek R1。

来自主题: AI资讯

6088 点击 2025-04-14 11:42

7B小模型写好学术论文，新框架告别AI引用幻觉，实测100%学生认可引用质量

7B小模型写好学术论文，新框架告别AI引用幻觉，实测100%学生认可引用质量

7B小模型写好学术论文，新框架告别AI引用幻觉，实测100%学生认可引用质量

学术写作通常需要花费大量精力查询文献引用，而以ChatGPT、GPT-4等为代表的通用大语言模型（LLM）虽然能够生成流畅文本，但经常出现“引用幻觉”（Citation Hallucination），即模型凭空捏造文献引用。这种现象严重影响了学术论文的可信度与专业性。

来自主题: AI技术研报

7135 点击 2025-04-11 10:20

斯坦福2025 AI指数出炉！中美AI终极对决差距仅剩0.3%，DeepSeek领衔

斯坦福2025 AI指数出炉！中美AI终极对决差距仅剩0.3%，DeepSeek领衔

斯坦福2025 AI指数出炉！中美AI终极对决差距仅剩0.3%，DeepSeek领衔

2025年斯坦福HAI报告重磅发布，456页深度剖析全球AI领域的最新趋势：中美顶级模型性能差距缩至0.3%，以DeepSeek为代表的模型强势崛起，逼近闭源巨头；推理成本暴降，小模型性能飙升，AI正变得更高效、更普惠。

来自主题: AI资讯

8328 点击 2025-04-08 16:45

单个4090就能跑，Mistral开源多模态小模型，开发者：用来构建推理模型足够香

单个4090就能跑，Mistral开源多模态小模型，开发者：用来构建推理模型足够香

单个4090就能跑，Mistral开源多模态小模型，开发者：用来构建推理模型足够香

多模态，性能超 GPT-4o Mini、Gemma 3，还能在单个 RTX 4090 上运行，这个小模型值得一试。

来自主题: AI资讯

4019 点击 2025-03-18 19:11

迁移DeepSeek-R1同款算法，小米让7B模型登顶音频理解推断MMAU榜单

迁移DeepSeek-R1同款算法，小米让7B模型登顶音频理解推断MMAU榜单

迁移DeepSeek-R1同款算法，小米让7B模型登顶音频理解推断MMAU榜单

7B小模型+3.8万条训练数据，就能让音频理解和推断评测基准MMAU榜单王座易主？

来自主题: AI技术研报

2846 点击 2025-03-17 10:52

14B 小模型逆袭翻译赛道，论文财报实测超Claude，不信试试“我命由我不由天”

14B 小模型逆袭翻译赛道，论文财报实测超Claude，不信试试“我命由我不由天”

14B 小模型逆袭翻译赛道，论文财报实测超Claude，不信试试“我命由我不由天”

都说通用大模型轻松拿捏翻译，结果有人来掀桌了。

来自主题: AI技术研报

4982 点击 2025-03-13 11:30

32B击败DeepSeek-R1、o3-mini，成本暴降100倍！GRPO让小模型称霸推理

32B击败DeepSeek-R1、o3-mini，成本暴降100倍！GRPO让小模型称霸推理

32B击败DeepSeek-R1、o3-mini，成本暴降100倍！GRPO让小模型称霸推理

32B小模型在超硬核「时间线索」推理谜题中，一举击败了o1、o3-mini、DeepSeek-R1，核心秘密武器便是GRPO，最关键的是训练成本暴降100倍。

来自主题: AI技术研报

9283 点击 2025-03-09 10:32

上一页当前第3页,共14页下一页