一种多模态命名实体识别方法及系统

申请号：CN202510906525

申请日期：2025-07-02

公开号：CN120975084A

公开日期：2025-11-18

类型：发明专利

摘要

本发明公开了一种多模态命名实体识别方法及系统，主要涉及计算机视觉与自然语言处理技术领域。包括以下步骤：提取文本、图片的文本特征、多模态文本特征、多模态图像特征和视觉对象特征；根据提取的文本特征获取文本隐藏特征；根据获取的文本隐藏特征获取采集到的文本中所有实体特征；根据多模态文本特征和多模态图像特征，获取归一化之后的多模态图像特征，以及文本‑图像相关性分数；输出惩罚并筛选之后的视觉对象特征；输出多模态融合特征；输出文本中每个单词的实体标签。本发明的有益效果在于：它在解决判断文本‑图像的相关性效果差的同时，解决了无法在判断文本与图像相关性之后同时使用粗粒度视觉信息与细粒度视觉信息。

技术关键词

命名实体识别方法视觉融合特征图像对象条件随机场标签跨模态变换器预训练模型序列解码模块图片多模态交互查询类别文本编码器代表