摘要
本申请涉及大模型技术领域,适用于金融科技及医疗健康养老领域,公开了一种大模型部署方法、装置、计算机设备及存储介质。方法包括:建立第一容器,通过第一容器加载目标大模型,并运行目标大模型;通过分组方式和/或量化方式,封装目标大模型,得到二进制格式的模型文件;删除第一容器中的目标大模型,根据第一容器生成镜像文件;关联模型文件与镜像文件,得到关联信息数据;将关联信息数据、模型文件和镜像文件传输至云存储设备。本申请的大模型部署方法,能够降低大模型的传输带宽、存储资源、部署流程与算力运维等方面的消耗,提升大模型的管理使用系统效能。