32B击败DeepSeek-R1、o3-mini,成本暴降100倍!GRPO让小模型称霸推理
32B击败DeepSeek-R1、o3-mini,成本暴降100倍!GRPO让小模型称霸推理32B小模型在超硬核「时间线索」推理谜题中,一举击败了o1、o3-mini、DeepSeek-R1,核心秘密武器便是GRPO,最关键的是训练成本暴降100倍。
搜索
32B小模型在超硬核「时间线索」推理谜题中,一举击败了o1、o3-mini、DeepSeek-R1,核心秘密武器便是GRPO,最关键的是训练成本暴降100倍。
助力半导体激光芯片国产化。
随着AI社交类应用在Z世代年轻人中的广泛流行,线上情绪陪伴的价值逐渐被深入挖掘。随时随地开启对话,句句有回应,事事不失联,给不少人都带来了心灵慰藉与个性化的情感支持。
短短六个月,面向消费者的生成式 AI 市场已发生翻天覆地的变化。一些产品迅速崭露头角,另一些却止步不前,还有意外的黑马一跃成为行业领跑者。
CVPR 2025,混合新架构MambaVision来了!Mamba+Transformer混合架构专门为CV应用设计。MambaVision 在Top-1精度和图像吞吐量方面实现了新的SOTA,显著超越了基于Transformer和Mamba的模型。
「Vibe Coding」(氛围编程)概念爆火!Y Combinator最新数据显示,其四分之一的W25届初创公司竟有95%的代码库由AI生成。Andrej Karpathy、吴恩达等AI大佬纷纷表示看好这种新趋势。
我们陆续知道她已经加入了一家AI创业公司,带起了自己的小团队,但业务方向还在摸索。去年12月,我们看到她开始在朋友圈和出海社群中做“200个想赚钱的美国大学生”的需求征集,2个月后这个需求调研落地为一个完整的素人种草平台XcreateAI。
见识过32B的QwQ追平671的DeepSeek R1后——刚刚,7B的DeepSeek蒸馏Qwen模型超越o1又是怎么一回事?新方法LADDER,通过递归问题分解实现AI模型的自我改进,同时不需要人工标注数据。
来自哥本哈根大学、苏黎世联邦理工学院等机构的研究人员,提出了一个全新的多模态Few-shot 3D分割设定和创新方法。无需额外标注成本,该方法就可以融合文本、2D和3D信息,让模型迅速掌握新类别。
诺奖级AI极大概率会在2026年降临!Anthropic向白宫提出可行的六大建议,从政策层面呼吁美国加速AI创新和风险管控。与此同时,AI正从实验室走向战场,五角大楼决定将智能体加入作战规划中。