深度学习模型的微调方法、计算机设备及介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
深度学习模型的微调方法、计算机设备及介质
申请号:CN202510346168
申请日期:2025-03-21
公开号:CN120278214A
公开日期:2025-07-08
类型:发明专利
摘要
本申请提供一种深度学习模型的微调方法、计算机设备及介质。本申请通过对目标编码解码层的目标线性变换模块中设置低秩矩阵,利用深度学习模型的模型训练数据集,对低秩矩阵中的矩阵参数进行更新,以实现对深度学习模型的微调,避免了对深度学习模型中的所有模型参数均进行更新,以减少显卡内存占用和计算开销,提高模型微调的效率。
技术关键词
深度学习模型 微调方法 矩阵 显卡 参数 解码 计算机设备 编码 可读存储介质 模块 策略 处理器 存储器 数据 内存 尺寸