一种基于多维度剪枝的多模态推理模型加速方法
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
一种基于多维度剪枝的多模态推理模型加速方法
申请号:
CN202510271349
申请日期:
2025-03-08
公开号:
CN120180364A
公开日期:
2025-06-20
类型:
发明专利
摘要
本发明公开了一种基于多维度剪枝的多模态推理模型加速方法,首先采用元路由器,基于简单高效的自注意力模型,用于自适应地组织剪枝工作流;然后考虑到传统的基于规则的令牌选择方法仅能提供有限的参考,引入了高斯噪声来扩展搜索空间;最后不依赖人工或自动化标注,利用模型输出的变化情况作为自监督信号动态优化元路由器。使用本发明的方法所加速的多模态推理模型在八个基准测试上达到了与最先进模型相当的性能,实现了模型的有效加速。
技术关键词
令牌
路由器
计算机存储介质
存储计算机程序
扩展搜索空间
计算机程序产品
视觉
处理器
文本
注意力模型
多模态
模型压缩
多层感知机
存储器
样本
注意力机制
序列
依赖人工
电子设备
工作流