一种异构多模态混合专家适配器

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种异构多模态混合专家适配器
申请号:CN202410844715
申请日期:2024-06-27
公开号:CN118708381B
公开日期:2025-04-01
类型:发明专利
摘要
本发明提出了一种异构多模态混合专家适配器,将传统单一类型的多模态MoE架构转变为多种专家类型的组合。该适配器将每个专家的输入从单一模态扩展到多个模态,实现每个专家内部的跨模态交互。具体地,本发明引入了包括交叉注意力专家和通道注意力专家在内的异构专家结构,将不同模态的输入映射到低秩空间,在该空间中进行模态交互融合,再映射回原始维度,使可训练参数能够有效调整冻结预训练模型的梯度,充分利用不同模态间的协同交互。全局路由器为每组专家分配权重,局部组路由器控制每个专家的门控权重。该适配器可集成到多模态预训练模型的编码器层中,在下游任务上仅微调可训练参数,保持推理阶段参数量基本不变。
技术关键词
嵌入特征 注意力 模态特征 适配器 多模态 异构 矩阵 编码器 路由器 预训练模型 通道 解码器 参数 数据 非线性 文本 视觉 网络 分类器 序列
系统为您推荐了相关专利信息
交通速度预测方法 地图数据服务器 变量 时序特征 序列
红外图像彩色化 注意力 彩色图像 掩膜数量 编码器
智能生成方法 多模态特征 局部线性嵌入算法 三元组 元素
多标签分类方法 遥感影像数据 空间结构特征 注意力机制 分支
智能标注方法 多模态 模型训练模块 训练集数据 标注系统