深度学习模型的微调方法、计算机设备及介质
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
深度学习模型的微调方法、计算机设备及介质
申请号:
CN202510346168
申请日期:
2025-03-21
公开号:
CN120278214A
公开日期:
2025-07-08
类型:
发明专利
摘要
本申请提供一种深度学习模型的微调方法、计算机设备及介质。本申请通过对目标编码解码层的目标线性变换模块中设置低秩矩阵,利用深度学习模型的模型训练数据集,对低秩矩阵中的矩阵参数进行更新,以实现对深度学习模型的微调,避免了对深度学习模型中的所有模型参数均进行更新,以减少显卡内存占用和计算开销,提高模型微调的效率。
技术关键词
深度学习模型
微调方法
矩阵
显卡
参数
解码
计算机设备
编码
可读存储介质
模块
策略
处理器
存储器
数据
内存
尺寸