AI资讯新闻榜单内容搜索-小模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 小模型
o3-mini数学推理暴打DeepSeek-R1?AIME 2025初赛曝数据集污染大瓜

o3-mini数学推理暴打DeepSeek-R1?AIME 2025初赛曝数据集污染大瓜

o3-mini数学推理暴打DeepSeek-R1?AIME 2025初赛曝数据集污染大瓜

就在刚刚,AIME 2025 I数学竞赛的大模型参赛结果出炉,o3-mini取得78%的最好成绩,DeepSeek R1拿到了65%,取得第四名。然而一位教授却发现,某些1.5B小模型竟也能拿到50%,莫非真的存在数据集污染?

来自主题: AI资讯
8225 点击    2025-02-10 11:21
小模型也能玩转RAG!性能仅降1%,存储省75%,边缘设备轻松跑

小模型也能玩转RAG!性能仅降1%,存储省75%,边缘设备轻松跑

小模型也能玩转RAG!性能仅降1%,存储省75%,边缘设备轻松跑

检索增强生成(RAG)虽好,但一直面临着资源消耗大、部署复杂等技术壁垒。近日,香港大学黄超教授团队提出MiniRAG,成功将RAG技术的应用门槛降至1.5B参数规模,实现了算力需求的大幅降低。这一突破性成果不仅为边缘计算设备注入新活力,更开启了基于小模型轻量级RAG的探索。

来自主题: AI资讯
7678 点击    2025-01-26 12:21
颠覆LLM格局!AI2新模型OLMo2,训练过程全公开,数据架构双升级

颠覆LLM格局!AI2新模型OLMo2,训练过程全公开,数据架构双升级

颠覆LLM格局!AI2新模型OLMo2,训练过程全公开,数据架构双升级

非营利研究机构AI2近日推出的完全开放模型OLMo 2,在同等大小模型中取得了最优性能,且该模型不止开放权重,还十分大方地公开了训练数据和方法。

来自主题: AI技术研报
5841 点击    2025-01-25 09:38
DeepSeek-R1 是怎么训练的|深度拆解

DeepSeek-R1 是怎么训练的|深度拆解

DeepSeek-R1 是怎么训练的|深度拆解

昨天晚上,DeepSeek 又开源了 DeepSeek-R1 模型(后简称 R1),再次炸翻了中美互联网: R1 遵循 MIT License,允许用户通过蒸馏技术借助 R1 训练其他模型。 R1 上线 API,对用户开放思维链输出 R1 在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版,小模型则超越 OpenAI o1-mini

来自主题: AI技术研报
18795 点击    2025-01-21 13:15
终于等到你!港大首发「轻量级RAG神器」MiniRAG,1.5B手机端可用

终于等到你!港大首发「轻量级RAG神器」MiniRAG,1.5B手机端可用

终于等到你!港大首发「轻量级RAG神器」MiniRAG,1.5B手机端可用

还在为部署RAG系统的庞大体积和高性能门槛困扰吗?港大黄超教授团队最新推出的轻量级MiniRAG框架很好地解决了这一问题。通过优化架构设计,MiniRAG使得1.5B级别的小模型也能高效完成RAG任务,为端侧AI部署提供了更多可能性。

来自主题: AI资讯
7255 点击    2025-01-16 16:14
7B模型数学推理击穿o1,直逼全美20%尖子生!四轮进化,微软华人新作爆火

7B模型数学推理击穿o1,直逼全美20%尖子生!四轮进化,微软华人新作爆火

7B模型数学推理击穿o1,直逼全美20%尖子生!四轮进化,微软华人新作爆火

小模型也能击败o1?微软全华人团队提出rStar-Math算法,三大革命性技术突破,不仅让SLM在数学推理能力上刷新SOTA,更是挤进了全美20%顶尖高中生榜单。

来自主题: AI技术研报
2783 点击    2025-01-10 15:51
「小模型」有更多机会点

「小模型」有更多机会点

「小模型」有更多机会点

大厂为什么追求大模型? 昨天有提到,为什么要研究语言模型。

来自主题: AI资讯
6160 点击    2025-01-08 14:50