大模型推理上限再突破:「自适应难易度蒸馏」超越R1蒸馏,长CoT语料质量飞升
大模型推理上限再突破:「自适应难易度蒸馏」超越R1蒸馏,长CoT语料质量飞升近年来,「思维链(Chain of Thought,CoT)」成为大模型推理的显学,但要让小模型也拥有长链推理能力却非易事。
近年来,「思维链(Chain of Thought,CoT)」成为大模型推理的显学,但要让小模型也拥有长链推理能力却非易事。
据新言科技报道,快手上线「喵记多」App,试水 AI 笔记赛道。该应用由快手旗下轻雀科技团队开发,更准确来说,来自协同办公产品「妙记多」团队。我们在「喵记多」上看到了 flomo、AI 宠物陪伴、Dola Agent 日程管理等产品的影子。
知名 Go 大佬 Thorsten Ball 最近用 315 行代码构建了一个编程智能体,并表示「它运行得非常好」且「没有护城河」(指它并非难以复制)。
GPT-4o更新后“变谄媚”?后续技术报告来了。
现在如果我想听音乐,我第一反应是:“我要用哪个服务?Spotify还是Tidal?”但这其实不是我真正的需求。我的真实意图是:“我想听这首歌。”我希望只要说出来,AI就能帮我搞定。
AI也会偷偷努力了?Letta和UC伯克利的研究者提出「睡眠时计算」技术,能让LLM在空闲时间提前思考,大幅提升推理效率。
颠覆LLM预训练认知:预训练token数越多,模型越难调!CMU、斯坦福、哈佛、普林斯顿等四大名校提出灾难性过度训练。
超越YOLOv3、Faster-RCNN,首个在COCO2017 val set上突破30AP的纯多模态开源LLM来啦!
企业内落地 Agent,三个关键点是模型、数据、场景。
技术在进化,验证码也该变得更有人情味一点。