一种自适应位宽的混合精度量化方法和系统
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
一种自适应位宽的混合精度量化方法和系统
申请号:
CN202510841463
申请日期:
2025-06-23
公开号:
CN120688560A
公开日期:
2025-09-23
类型:
发明专利
摘要
本申请提供一种自适应位宽的混合精度量化方法和系统,方法包括:为模型中各个模块分别配置具有可变位宽的量化器;设定每个模块的损失函数及其上界和下界;根据所述损失函数的数值与所述上界、下界的对比情况,逐模块自动调整对应的所述量化器的位宽,得到混合精度的模型。本申请采用了基于模块特性差异的自适应精度分配技术方案,通过动态感知各子模块在网络结构中的重要性、数值分布以及抗量化扰动能力,为不同模块精准分配适配的量化位宽,带来了在不显著增加整体计算资源开销的前提下,充分释放模型压缩潜力的技术效果。
技术关键词
量化器
模块
精度
特征提取模型
边缘计算方法
图像重建方法
校准
量化系统
数值
模型压缩
神经网络模型
网络结构
云端
参数
信号
阶段
动态