大模型部署方法、装置、计算机设备及存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
大模型部署方法、装置、计算机设备及存储介质
申请号:CN202510823949
申请日期:2025-06-18
公开号:CN120743293A
公开日期:2025-10-03
类型:发明专利
摘要
本申请涉及大模型技术领域,适用于金融科技及医疗健康养老领域,公开了一种大模型部署方法、装置、计算机设备及存储介质。方法包括:建立第一容器,通过第一容器加载目标大模型,并运行目标大模型;通过分组方式和/或量化方式,封装目标大模型,得到二进制格式的模型文件;删除第一容器中的目标大模型,根据第一容器生成镜像文件;关联模型文件与镜像文件,得到关联信息数据;将关联信息数据、模型文件和镜像文件传输至云存储设备。本申请的大模型部署方法,能够降低大模型的传输带宽、存储资源、部署流程与算力运维等方面的消耗,提升大模型的管理使用系统效能。
技术关键词
云存储设备 模型部署方法 生成镜像文件 云存储系统 容器 操作系统 计算机设备 数据 处理器 可读存储介质 系统效能 医疗健康 封装模块 测试模块 传输模块 接口 格式 存储器