一种基于正交特征的大语言模型量化方法及加速器架构

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于正交特征的大语言模型量化方法及加速器架构
申请号:CN202511587377
申请日期:2025-11-03
公开号:CN121031687A
公开日期:2025-11-28
类型:发明专利
摘要
本发明属于大语言模型量化技术领域,具体涉及一种基于正交特征的大语言模型量化方法及加速器架构,量化方法将大语言模型的激活张量分割为多个列块,并以列块为粒度为整个激活张量分配FP4量化格式。本发明列块的概念定义为:将激活张量的矩阵分割为多个元素数量相同的段,其中段中各元素连续排列在矩阵的第一维度的同一行中,且排列在第二维度的连续的多个列中;列块包括第二维度的多个列,每个列块中列的数量与段中元素的数量一致。本发明克服了现有大语言模型分组量化技术中存在的缺陷,解决了大语言模型精度与硬件效率之间的矛盾。
技术关键词
格式 地址生成器 加速器 索引 大语言模型 数据 缩放单元 指数 执行矩阵乘法 元素 阵列 乘法器 核心 符号 处理单元 因子 模块 分割方法 周期
系统为您推荐了相关专利信息
平面图 变电站 信息识别方法 实体 电气
格式 人工智能算法 生成方法 标识 通信接口
协同过滤算法 打印机 界面 习惯 高精度传感器
处理单元 自定义参数 标签 链路 展示模型
织物试样 评级方法 相机标定 图像校正 点云信息