开源「仓颉.Skill」2.0,你现在可以蒸馏任何视频!
开源「仓颉.Skill」2.0,你现在可以蒸馏任何视频!大家好,我是袋鼠帝。 没想到cangjie-skill在4月开源,中间没怎么推,两个月还慢慢涨到了1.3K Star,有点出乎我的意料。
搜索
大家好,我是袋鼠帝。 没想到cangjie-skill在4月开源,中间没怎么推,两个月还慢慢涨到了1.3K Star,有点出乎我的意料。
Agent从来不是不会用浏览器,只是浪费太多时间在探索——BrowserBC把人类轨迹蒸馏成可复用Skill来完成Behavior Cloning,用户点一遍,Agent照着就能跑通。Einsia AI旗下Navers Lab发布的开源项目BrowserBC给出的答案,是一条三步范式:录制→转写成Skill→交付执行。
最近看到越来越多的一些国民级产品,开始把自己的一些能力,给封装称Skill或者MCP,来向大家开放,我觉得这个大家逐渐为Agent来做能力的趋势,越来越明显了。特别是前段时间瑞幸咖啡上线了AI开放平台,支持MCP、CLI、Skill三种接入方式。
在常规的对话外,Claude Code(也可以是 Codex)其实还提供了一些别样的控制(或者说:上下文注入)方法,比如:CLAUDE.md、Rules、Skills、Subagents、Hooks、Output Styles、以及 System Prompt Append
从v0.7开始,我先给 Humanize PPT 划了一条边界。把渲染PPT页面外包给下游的Skill。Humanize PPT负责把大纲,逐页意图,视频和图片素材的坑位和演讲稿,整理成结构化的 JSON 与 Markdown,再交给下游 Skill 原生渲染。
PD大促还有两个周就开始了,不知道做亚马逊的你们词库搭好了吗?
昨天 Kimi K2.7 Code 高速版 上线了,我上手试了下,最大的感受就一个字:快。
大家好,我是袋鼠帝 前两天一个朋友问我,怎么边工作,边把自媒体持续做下去,还能做得好。
Workflow、Skill、SOP,可能真的要过时了。
5 月中旬,一个名叫 anysearch-skill 的开源仓库出现在 GitHub 上,一周之内冲上了 Agent 技能市场 Skills.sh 的热榜第一。开发者们发现,给自己的 Agent 装上这个 Skill 之后,原本要搜七八轮才能拼凑完整的调研任务,常常一两次调用就能拿到结果,而且返回的不是网页链接,是可以直接进推理链路的结构化数据。