摘要
本申请公开了面向水利工程图像的表格结构的智能提取方法与系统。该方法包括:获取水利工程图像,并进行预处理;将预处理后的水利工程图像输入到改进的HAWP模型中得到预测的候选线段;对候选线段进行聚类操作,得到初步表格框架线段集合;对聚类过程中被排除的线段进行二次筛选后重新加入初步表格框架线段集合,进行合并断裂线段、剔除冗余和孤立线段操作,得到更新后的表格线段集合;确定表格外部边界,分析表格内部行列结构和行高列宽分布,并识别合并单元格区域,生成完整表格结构模型;计算所有水平线与垂直线交点,建立单元格坐标系统,将完整表格结构模型转化为二维矩阵数据并生成行列网络模型。本申请能够提升表格结构提取的精度和鲁棒性。