一种文档版面分析方法、装置、设备、存储介质及程序产品
申请号:CN202510987540
申请日期:2025-07-17
公开号:CN120877306A
公开日期:2025-10-31
类型:发明专利
摘要
本发明公开了一种文档版面分析方法、装置、设备、存储介质及程序产品。将待分析的文档图像输入目标检测模型,获得各元素的边界框;基于所述边界框对将各元素进行裁剪,获得多张元素图像;对于每张元素图像,基于图像分类模型确定所述元素图像分别与多个类别的参考元素图像之间的第一关系特征和第二关系特征;基于所述第一关系特征和所述第二关系特征确定所述元素图像与各类别的参考元素图像间的相似度;根据所述相似度确定所述元素图像的类别。本发明实施例提供的文档版面分析方法,通过第一关系特征和第二关系特征确定元素图像与各类别的参考元素图像间的相似度,从而确定元素的类别,可以提高文档板面分析的效率和准确性。
技术关键词
文档版面分析方法
多级特征
图像分类模型
元素
特征提取单元
协同注意力
关系
可读存储介质
裁剪模块
多层感知机
训练集
计算机程序产品
分析装置
电子设备
处理器通信
存储器