一种文档文件的表格识别方法及相关装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种文档文件的表格识别方法及相关装置
申请号:CN202510016587
申请日期:2025-01-06
公开号:CN119445601B
公开日期:2025-04-25
类型:发明专利
摘要
本申请公开一种文档文件的表格识别方法及相关装置,涉及计算机应用与人工智能领域,所述方法包括:将待处理文档文件的页面转换成第一图像;对第一图像进行图像增强得到第二图像;利用目标智能体对第二图像进行表格检测,得到表格区域位置信息;目标智能体包括基于双支路模型调优构建的表格检测模型,目标智能体的第一支路用于学习与提取表格的结构性特征,第二支路用于学习与提取表格的文本语义特征;识别所述表格区域位置信息所指示表格区域中的表格数据,并将表格数据转换为结构化形式进行输出。本申请通过在表格识别中结合使用图像增强处理和基于深度学习的双支路模型调优等技术,可实现对文档文件进行高精度、高效率、高适应性的表格识别。
技术关键词
深度学习模型 表格识别方法 二值化图像 区域位置信息 语义特征 颜色 卷积神经网络提取 文本 轮廓信息 图像转换模块 像素 图像增强模块 对比度 样本 校正 数据 支路