基于类型引导交互的多模态命名实体识别方法和系统、电子设备及计算机可读存储介质
申请号:CN202411839124
申请日期:2024-12-13
公开号:CN119721039A
公开日期:2025-03-28
类型:发明专利
摘要
本发明公开了基于类型引导交互的多模态命名实体识别方法和系统、电子设备及计算机可读存储介质,属于多模态命名实体识别技术领域。解决了现有技术中传统的多模态命名实体识别方法因模型难以捕获模态间语义的对应关系导致的识别结果不准确的问题;本发明通过图文对层级提取模块和实体类别提取模块,提取特征;通过类别引导的注意力模块,生成实体类别引导的文本和视觉表示以及增强的实体类别表示;通过基于注意力机制的跨模态层级交互模块,生成对实体类别敏感性强的多模态表示;通过带有类型引导单模态辅助任务的联合学习模块,生成图像文本对的预测序列。本发明有效提升了对图像和文本的识别精度,可以应用于识别和提取命名实体。
技术关键词
命名实体识别方法
层级
代表
命名实体识别系统
跨模态
矩阵
多模态
模块
模态特征
融合视觉
图像
多头注意力机制
文本编码器
命名实体识别技术