ShellAgent 2.0,
没有选择卷复杂华丽的前端页面,而是闷头把后台交互卷到极致。
也就是说,我们写生成应用提示语的难度降到了有嘴就会的级别。
Three.js、CDN、Tailwind Nextjs、JavaScript等一大堆专业名词都不用记了,只需要说:
开发一个应用,能上传PDF,总结内容,并将其转化为播客。
它就开始kuku一通分析了,
先理解我的需求,从需求里面提取出核心功能,然后从自己的组件库里面找到能用的,
接下来就开始模拟跟我的交互流程,以及代码生成计划了。
生成前的最后一步,ShellAgent还会确认更多的细节,
最右侧页面会有文字版的执行进度,以及流程图形式的实时构建过程。
这个就是PDF转中文播客的本体了,
🔗 app.myshell.ai/bot/yIf2Yv
目前ShellAgent是支持三个任务同时运行的,不需要一个个等。
执行过程中遇到bug也不用担心,点击「Fix with ShellAgent」,就能一键修复。这里的修改是会按照最小原则来的,不会破坏原有的需求。
我这里就是因为获取100个帖子超过模型上下文了,它给我调出成25个,一个更合适的数目。
除了多模态交互,文本转语音、文本转图像、图像转图像等方式,
ShellAgent还擅长把各种API整合在一起,第一个case是它的舒适区,
那第二个case我让gpt选了一个比较冷门的垂直领域方向,
创建一个招聘信息整合平台,从 AngelList 抓取与 AI 相关的职位信息,按照远程友好性和薪资进行筛选,并输出一份精选职位列表。
生成出来的应用会解析这个API需要的参数,这里是api key、职位工作内容、工作地、最低工资和技能水平等等。
甚至提示语都可以不要,ShellAgent还有Remix模式,
可以把自己做过的App换成别的风格,
也可以看到别人公开的好看应用的话,
几句话改改就可以变成我想要的样子,@藏师傅的运势推算App效果蛮不错的,支持多参数输入、输出报告,还能输出海报。
很好,现在是我的了(狗头保命),我也不需要知道提示语。
在 Remix 模式下,我想把16人格的也加进去看看。
把16人格的运势推算也加进去
十道题可以测试16人格加上本周运势,作为一个从ENTJ转到INFJ的人来说,我只想说这里就差一个星座就能集齐库里南碎片。
就是那么简单。
ShellAgent 不需要你提前准备什么,
它本来就是给“不知道怎么做但想试一试”的人准备的。
你不用学提示语,不用懂组件,甚至都不用打开 VS Code。
了解ShellAgent最好的方法,就是直接上手试。
把你想要的,原样敲进去就行了。
别修饰,别优化,也别担心“这个需求是不是太蠢了”。
你说得越直白,它越听得懂。
它不是让你变成开发者,
它是让你,不用变成开发者,也能做点什么出来。
所以,如果你脑子里刚好有点什么,
别管它是不是 idea,
打开 ShellAgent,
试试看,它会给你个惊喜。
🔗 app.myshell.ai/robot-workshop
文章来自于微信公众号“卡尔的AI沃茨”,作者是“AI沃茨”。
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md