6000字解读:当前大语言模型LLM研究的10大挑战
6000字解读:当前大语言模型LLM研究的10大挑战大模型赛道已经吸引了大量企业或创业者投入,那么,目前大模型赛道都有哪些主流研究方向和共同挑战?这篇文章里,作者梳理了LLM研究的十大挑战,一起来看看
大模型赛道已经吸引了大量企业或创业者投入,那么,目前大模型赛道都有哪些主流研究方向和共同挑战?这篇文章里,作者梳理了LLM研究的十大挑战,一起来看看
在新模型发布后,智谱 AI CEO 张鹏和极客公园聊了聊他们的近况和一些行业认知。谈到与ChatGLM2相比,智谱 AI 此次瞄准 GPT-4V 推出的 ChatGLM 3 性能更加强大,接入了具有多模态理解能力的模型 CogVLM、代码增强模块 Code Interpreter、网络搜索增强模型 WebGLM,并增强了语义理解和逻辑理解能力,实现了若干功能的迭代升级。
OpenAI在首次开发者大会上宣布推出GPT-4 Turbo和众多新功能,包括Assistant API、多模态功能和GPT Store。GPT-4 Turbo具有更大的上下文窗口和更快的输出速度,而Assistant API使开发者更容易构建自己的AI应用程序。同时,GPT Store将允许用户创建和分享自定义版本的GPT。
北京时间11月7日凌晨2点,在ChatGPT推出近一年后,OpenAI首届开发者大会(OpenAI DevDay)在旧金山举行。首次公布了AI Agent相关功能GPTs——人人都能做自己的GPT。并且,OpenAI还开放大量的新API.
多个领域出现AI Agent架构与产品,已然证明AI智能体的高渗透率和高成长空间。鉴于AI智能体的多重优势以及未来市场前景,接下来必然会有更多领域推出不同功能的AI Agent,而面向不同领域不同业务场景和功能的AI智能体,也将成为LLM创业者的全新机会。
最近,由CMU/MIT/清华/Umass提出的全球首个生成式机器人智能体RoboGen,可以无限生成数据,让机器人7*24小时永不停歇地训练。AIGC for Robotics,果然是未来的方向。
今天,智谱AI开源其第三代基座大语言模型ChatGLM3-6B,官方说明该模型的性能较前一代大幅提升,是10B以下最强基础大模型!
WorkMagic成立于 2023 年,定位于生成式 AI 驱动的多Agent营销SaaS平台。公司现阶段主要面向 Shopify 等独立站中小电商商家提供覆盖客户管理、商品管理和营销管理的端到端 AI 原生营销解决方案。依托「LLM+API+Marketplace」的 AI agent 设计,WorkMagic 旨在帮助客户实现营销目标的拆解、分析、推理,以及营销计划的设计和执行。
今年爆火的智能体项目AutoGPT,现获得了1200万美元融资。不得不说,Auto-GPT在AI领域掀起了巨大的波澜,它就像是赋予了GPT-4记忆和实体一样,让它能够独立应对任务,甚至从经验中学习,不断提高自己的性能。
智谱AI&清华KEG提出了一种对齐 Agent 能力的微调方法 AgentTuning,该方法使用少量数据微调已有模型,显著激发了模型的 Agent能力,同时可以保持模型原有的通用能力。