基于数据增强的多模态实体连接方法

申请号：CN202411613963

申请日期：2024-11-13

公开号：CN119128813B

公开日期：2025-03-14

类型：发明专利

摘要

本发明公开了一种基于数据增强的多模态实体连接方法，涉及数据处理技术领域，包括：利用大语言模型对实体增强，通过设计指令对实体描述进行摘要处理，提取关键信息并优化；利用多模态大语言模型对语义信息增强，通过融合文本和视觉特征生成增强的信息描述，包括实体的名称、类型、功能及行为特征、物理或结构属性，以及从视觉信息中提取的空间结构、外观形态、颜色纹理等视觉特征；通过检索技术来扩展和优化候选实体集合，实现检索增强；使用大语言模型进行决策性选择，从检索增强得到的候选实体集合中选择最佳匹配项。本发明通过多层次的数据增强和精确的实体选择过程，显著提高了多模态实体链接的准确性和效率。

技术关键词

大语言模型摘要文本语义实体消歧模板空间结构检索技术字符串匹配算法属性匹配视觉特征信息指令更新模型参数多模态信息度计算方法置信度阈值