一种多模态数据处理方法和装置
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
一种多模态数据处理方法和装置
申请号:
CN202510237514
申请日期:
2025-02-28
公开号:
CN120181133A
公开日期:
2025-06-20
类型:
发明专利
摘要
本申请公开了一种多模态数据处理方法和装置,该方法包括:获得待处理的N张图像以及任务指示信息,任务指示信息表征至少基于N张图像之间的关联关系执行目标处理任务,N为大于等于2的整数;通过视觉编码器确定N张图像的细节特征和全局特征;基于细节特征和全局特征的融合特征,通过视觉映射器将融合特征映射为自然语言特征;通过大语言模型处理自然语言特征以及任务指示信息的文本特征,以至少基于N张图像之间的关联关系,执行目标处理任务。
技术关键词
大语言模型
自然语言
样本
残差网络
数据处理方法
融合特征
中间层
文本
关系
视觉
图像生成模型
模块
数据处理单元
数据处理装置
多模态
参数