一种多模态数据处理方法和装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种多模态数据处理方法和装置
申请号:CN202510237514
申请日期:2025-02-28
公开号:CN120181133A
公开日期:2025-06-20
类型:发明专利
摘要
本申请公开了一种多模态数据处理方法和装置,该方法包括:获得待处理的N张图像以及任务指示信息,任务指示信息表征至少基于N张图像之间的关联关系执行目标处理任务,N为大于等于2的整数;通过视觉编码器确定N张图像的细节特征和全局特征;基于细节特征和全局特征的融合特征,通过视觉映射器将融合特征映射为自然语言特征;通过大语言模型处理自然语言特征以及任务指示信息的文本特征,以至少基于N张图像之间的关联关系,执行目标处理任务。
技术关键词
大语言模型 自然语言 样本 残差网络 数据处理方法 融合特征 中间层 文本 关系 视觉 图像生成模型 模块 数据处理单元 数据处理装置 多模态 参数