一种基于统一模型架构的多模态数据合成方法、装置、设备、介质及产品

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于统一模型架构的多模态数据合成方法、装置、设备、介质及产品
申请号:CN202511587749
申请日期:2025-11-03
公开号:CN121030696A
公开日期:2025-11-28
类型:发明专利
摘要
本发明公开了一种基于统一模型架构的多模态数据合成方法、装置、设备、介质及产品,涉及信息提取技术领域,该方法先获取包括图像数据、文本数据、音频数据、传感器数据的待合成数据,经预处理得到对应各模态的序列数据;再基于序列数据提取全局语义因子、局部语义因子、细节三级语义因子,全局语义因子通过任务指令筛选候选模板并结合序列数据评分得到,局部语义因子由序列数据聚类后特征池化生成,细节语义因子依据序列数据的重建误差及其变化得到;将各模态序列数据与对应标识合成,并和三级语义因子拼接为合成序列数据;最后把合成序列数据输入同一transformer编码器完成多模态数据合成,实现多模态数据的高效协同与深度整合。
技术关键词
语义 因子 图像序列数据 重建误差 文本 音频 传感器 多模态 模板 标识 计算机程序产品 信息提取技术 指令 编码器 可读存储介质 存储计算机程序
系统为您推荐了相关专利信息
自然语言 评审方法 文本 生成训练样本 语义
图像识别技术 计价方法 管道 造价 圆形检测方法
孤独症儿童 多模态注意力 监护方法 情感特征 语音特征
患者 命名实体识别模型 预训练语言模型 层次分析算法 多头注意力机制
QoE优化方法 全景视频流 信道 比特翻转算法 循环冗余校验