小模型用不好Skill?新范式SKILL0让模型学会Skill的底层逻辑,3B模型推理token省5倍
小模型用不好Skill?新范式SKILL0让模型学会Skill的底层逻辑,3B模型推理token省5倍浙江大学联合美团龙猫团队、清华大学推出全新研究成果——SKILL0,并提出技能内化(Skill Internalization)——小模型真正需要的,或许不是推理时的“外挂技能”,而是将技能内化为本能。
搜索
浙江大学联合美团龙猫团队、清华大学推出全新研究成果——SKILL0,并提出技能内化(Skill Internalization)——小模型真正需要的,或许不是推理时的“外挂技能”,而是将技能内化为本能。
4 月 10 日晚,灵初智能发布了大模型、数据集与合作计划:包括策略模型 Psi-R2、世界模型 Psi-W0,以及总规模近 10 万小时的人类操作数据。它想回答的问题也很直接 —— 当真机数据不再是唯一解,机器人还能靠什么继续 scaling?
不知道你们有没有发现,Anthropic最近状况频出得有些反常。又是泄露源代码、又是词元计费BUG,又是降智。小毛病不断、画面不断,讨论声也不断。多少掺点,拿bug当热点炒,蹭免费热搜了。这不,刚又给龙虾之父Peter账号封了。
过去一个月,是今年 AI 产品发布最密集的一个阶段。 如果你留意近期 AI 产品的进展,你会发现,出现了一批真正能主动干活的 Agent 产品。不再是聊天框、问答工具,更像是人类的分身:能自己操控电脑
字节Seed最新研究,让大模型能“原地改参数”了。既不用改模型结构,也不用重新训练,还跑得很快。具体是这么个情况。智能体时代嘛,大家都知道模型们面对的任务开始变得越来越复杂、上下文越来越长。
《终结者》导演詹姆斯·卡梅隆过去的一番论断,迎来了热议:AGI不会来自政府项目,而是由科技巨头打造。这比我在40年前《终结者》中描绘的情景更可怕,因为至少现在它已不再是科幻小说了。
多模态大推理模型的幻觉,很多时候并非「没看见」,而是在最不确定的推理阶段想偏了。最新研究发现,模型在生成because、however、wait等transition words时,往往处于高熵关键节点,更容易脱离图像证据、转向语言脑补。LEAD在高熵阶段不急于输出单一离散token,而是先在潜在语义空间保留多种候选推理方向,并通过视觉锚点持续拉回图像证据,显著缓解幻觉。
哦豁,马斯克一个“不小心”,把Claude参数抖出来了???长话短说:Sonnet 1T、Opus 5T。起因是老马发帖表示,xAI的Colossus 2超算正在训练7个模型,其中最大的一款,参数量直接冲到了10万亿。
《读佳》独家获悉,腾讯做了一款全新的AI创作产品“啵哔酱”,由深圳市网视界科技有限公司(下称“网视界”)开发,根据人民网此前发布的《内测“有记”,腾讯社交新品接二连三攻占细分市场》报道,以及澎湃新闻的相关报道可知,腾讯发布的“有记”、“朋友”等社交APP均为网视界开发,故这里不再对网视界和腾讯之间的关系做过多赘述。目前该产品还处于打磨测试阶段。
MBTI已经过时了!今天,全网被新型SBTI人格测试刷屏,服务器瞬间被挤崩。更狠的是,不到48小时,就有开发者用Claude Code完成了完整逆向复刻。它由B站UP主「蛆肉儿串儿」一人打造,没想到,却被网友们疯狂测试直接挤爆了服务器。