大语言模型的数据处理方法、装置、设备和存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
大语言模型的数据处理方法、装置、设备和存储介质
申请号:CN202411601877
申请日期:2024-11-11
公开号:CN119783726B
公开日期:2025-09-19
类型:发明专利
摘要
本公开提供了一种大语言模型的数据处理方法,可以应用于深度学习技术领域,包括:将文本数据输入大语言模型,输出对根据文本数据翻译得到的文本序列,大语言模型包括中间层;在中间层中,利用门控线性单元的门控投影对中间层上一层输出的待激活数据进行处理,得到第一激活数据,第一激活数据为整数类型的数据;利用移位器对第一激活数据进行移位,得到移位激活数据;利用线性整流函数对移位激活数据与第一激活参数的和进行处理,得到第一中间数据;从第一中间数据与第二激活参数中筛选出第二中间数据;利用乘法器对第一激活数据、第二中间数据与第三激活参数进行乘法运算,得到待移位数据;利用移位器对待移位数据进行移位,得到第二激活数据。
技术关键词
大语言模型 参数 线性单元 中间层 数据处理方法 文本 因子 乘法器 深度学习技术 数据处理装置 非线性 移位器 处理器 序列 可读存储介质 变量 矩阵 电子设备