PyTorch官方认可!斯坦福博士新作:长上下文LLM推理速度提8倍
PyTorch官方认可!斯坦福博士新作:长上下文LLM推理速度提8倍这两天,FlashAttention团队推出了新作: 一种给Transformer架构大模型推理加速的新方法,最高可提速8倍。 该方法尤其造福于长上下文LLM,在64k长度的CodeLlama-34B上通过了验证
搜索
这两天,FlashAttention团队推出了新作: 一种给Transformer架构大模型推理加速的新方法,最高可提速8倍。 该方法尤其造福于长上下文LLM,在64k长度的CodeLlama-34B上通过了验证
联发科今日宣布与 vivo 在 AI 领域深度合作和联调,率先实现了 10 亿和 70 亿 AI 大语言模型以及 10 亿 AI 视觉大模型在手机端侧的落地
10月17日,金山办公与科大讯飞宣布达成战略合作,双方将在既有合作基础上,在数字办公产品、行业解决方案、AI大模型、开放能力集成等多维度展开深度合作
10月17日,王小川旗下百川智能官宣已完成A1轮战略融资,融资金额3亿美元,阿里、腾讯、小米、深创投等科技巨头及多家顶级投资机构参投。
ChatGPT之类的AI编码工具来势汹汹,Stack Overflow又裁员了!不过,普林斯顿和芝大竟发现,面对真实世界GitHub问题,GPT-4的解决率竟是0%。
Zilliz和 Dify.AI 达成合作,Zilliz 旗下的产品 Zilliz Cloud、Milvus 与开源 LLMOps 平台 Dify 社区版进行了深度集成。
李彦宏以《手把手教你做AI原生应用》为主题发表演讲,发布文心大模型4.0版本,并带来新搜索、新地图等十余款AI原生应用。
国内领先的人工智能大模型公司面壁智能又放大招,联合清华大学 NLP 实验室共同研发并推出大模型「超级英雄」——XAgent。
中国科学院国家天文台银河系三维结构团组最近在wisemodel.cn社区开源的星语StarWhisper天文大模型,在甲骨易AI研究院与LanguageX AI Lab联合发布的CG-Eval上达到总排名第二,仅低于GPT-4。
金睛云华成功完成了近亿元的B轮融资,本轮融资由知名产业投资机构奇安投资与知名网络和数据安全上市公司永信至诚共同投资,明德资本担任公司本轮融资独家财务顾问。