摘要
本申请提供一种基于多模态大模型的知识结构化抽取方法,涉及数据处理技术领域。包括:根据数据抽取需求,确定待抽取属性信息,并根据待抽取属性信息,生成结构化数据模型;根据结构化数据模型,按照预设的抽取策略,对待处理的原始多模态文件进行数据抽取,得到多个抽取结果;对多个抽取结果进行合并处理,得到合并抽取结果;对合并抽取结果进行校验,得到目标抽取结果。本方法在通过多模态大模型进行知识抽取中,通过多轮抽取结合分阶段抽取的抽取策略,可以降低模型一次抽取的数据量,避免数据抽取遗漏,同时分阶段抽取使得模型可以由粗到细,由全局理解到字段级精抽逐步递进,避免上下文丢失,提升抽取结果的精度。