多模态图片数据处理方法、装置、设备及存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
多模态图片数据处理方法、装置、设备及存储介质
申请号:CN202511566534
申请日期:2025-10-30
公开号:CN121030026A
公开日期:2025-11-28
类型:发明专利
摘要
本申请涉及计算机视觉与多模态数据处理技术领域,公开了多模态图片数据处理方法、装置、设备及存储介质,该方法包括:对预先获取的标准化图片集合进行多维度特征提取,得到复合特征数据;将所述复合特征数据及预设提示词输入多模态大模型,生成自然语言描述文本,并从所述自然语言描述文本中提取关键语义信息,形成结构化语义集合;对所述标准化图片集合、复合特征数据及结构化语义集合进行关联存储,并基于关联存储数据构建多模态索引。本申请基于多维度特征提取并多模态大模型的语义理解,实现了多模态图片数据的深度理解。
技术关键词
图片数据处理方法 多维度特征提取 多模态 生成自然语言 索引 文本 图片数据处理装置 语义标签 视觉 业务系统数据库 对象存储系统 标识符 分词 数据连接器 数据处理设备 特征提取模块