AI资讯新闻榜单内容搜索-小模型

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 小模型

陈丹琦新作：大模型强化学习的第三条路，8B小模型超越GPT-4o

陈丹琦新作：大模型强化学习的第三条路，8B小模型超越GPT-4o

陈丹琦新作：大模型强化学习的第三条路，8B小模型超越GPT-4o

结合RLHF+RLVR，8B小模型就能超越GPT-4o、媲美Claude-3.7-Sonnet。陈丹琦新作来了。他们提出了一个结合RLHF和RLVR优点的方法，RLMT（Reinforcement Learning with Model-rewarded Thinking，基于模型奖励思维的强化学习）。

来自主题: AI技术研报

9075 点击 2025-09-28 23:03

刚刚，北大&360里程碑式突破！32B安全分碾压千亿巨兽

刚刚，北大&360里程碑式突破！32B安全分碾压千亿巨兽

刚刚，北大&360里程碑式突破！32B安全分碾压千亿巨兽

打破思维惯性，「小模型」也能安全又强大！北大-360联合实验室发布TinyR1-32B模型，以仅20k数据的微调，实现了安全性能的里程碑式突破，并兼顾出色的推理与通用能力。

来自主题: AI资讯

7404 点击 2025-09-28 09:54

刚刚，英伟达新模型上线！4B推理狂飙53倍，全新注意力架构超越Mamba 2

刚刚，英伟达新模型上线！4B推理狂飙53倍，全新注意力架构超越Mamba 2

刚刚，英伟达新模型上线！4B推理狂飙53倍，全新注意力架构超越Mamba 2

Jet-Nemotron是英伟达最新推出的小模型系列（2B/4B），由全华人团队打造。其核心创新在于提出后神经架构搜索（PostNAS）与新型线性注意力模块JetBlock，实现了从预训练Transformer出发的高效架构优化。

来自主题: AI技术研报

7507 点击 2025-08-26 19:34

清华校友出手，8B硬刚GPT-4o！单一模型无限工具调用，终结多智能体

清华校友出手，8B硬刚GPT-4o！单一模型无限工具调用，终结多智能体

清华校友出手，8B硬刚GPT-4o！单一模型无限工具调用，终结多智能体

大模型再强，也躲不过上下文限制的「蕉绿」！MIT等团队推出的一套组合拳——TIM和TIMRUN，轻松突破token天花板，让8b小模型也能实现大杀四方。

来自主题: AI资讯

7261 点击 2025-08-22 17:14

Meta没做的，英伟达做了！全新架构吞吐量狂飙6倍，20万亿Token训练

Meta没做的，英伟达做了！全新架构吞吐量狂飙6倍，20万亿Token训练

Meta没做的，英伟达做了！全新架构吞吐量狂飙6倍，20万亿Token训练

英伟达发布全新架构9B模型，以Mamba-Transformer混合架构实现推理吞吐量最高提升6倍，对标Qwen3-8B并在数学、代码、推理与长上下文任务中表现持平或更优。

来自主题: AI资讯

7765 点击 2025-08-19 11:35

英伟达新研究：小模型才是智能体的未来

英伟达新研究：小模型才是智能体的未来

英伟达新研究：小模型才是智能体的未来

大模型OUT，小模型才是智能体的未来！这可不是标题党，而是英伟达最新论文观点：在Agent任务中，大语言模型经常处理重复、专业化的子任务，这让它们消耗大量计算资源，且成本高、效率低、灵活性差。

来自主题: AI资讯

7388 点击 2025-08-19 11:24

4o-mini华人领队也离职了，这次不怪小扎

4o-mini华人领队也离职了，这次不怪小扎

4o-mini华人领队也离职了，这次不怪小扎

哦豁，OpenAI奥特曼又痛失一员大将。 Kevin Lu，领导4o-mini发布，并参与o1-mini、o3发布，主要研究强化学习、小模型和合成数据。

来自主题: AI资讯

6950 点击 2025-08-19 11:20

告别RAG延迟！LLM首个即插即用“记忆解码器”问世！

告别RAG延迟！LLM首个即插即用“记忆解码器”问世！

告别RAG延迟！LLM首个即插即用“记忆解码器”问世！

一句话概括，还在嫌弃RAG太慢？这帮研究员直接把检索数据库"蒸馏"成了一个小模型，实现了不检索的检索增强，堪称懒人福音。

来自主题: AI技术研报

7555 点击 2025-08-18 11:48

又是王冠：27M小模型超越o3-mini！拒绝马斯克的00后果然不同

又是王冠：27M小模型超越o3-mini！拒绝马斯克的00后果然不同

又是王冠：27M小模型超越o3-mini！拒绝马斯克的00后果然不同

27M小模型超越o3-mini-high和DeepSeek-R1！推理还不靠思维链。开发者是那位拒绝了马斯克、还要挑战Transformer的00后清华校友，Sapient Intelligence的创始人王冠。

来自主题: AI技术研报

7231 点击 2025-08-10 15:00

手机也能跑，腾讯混元一口气开源4款小模型

手机也能跑，腾讯混元一口气开源4款小模型

手机也能跑，腾讯混元一口气开源4款小模型

刚刚，腾讯混元团队宣布一口气开源了 4 款小模型 —— 最大的只有 7B，另外还包括 4B、1.8B 和 0.5B 三个型号。

来自主题: AI资讯

7909 点击 2025-08-04 20:36

上一页当前第2页,共15页下一页