基于人工智能的文档处理方法、装置、设备及介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于人工智能的文档处理方法、装置、设备及介质
申请号:CN202510919774
申请日期:2025-07-03
公开号:CN120766302A
公开日期:2025-10-10
类型:发明专利
摘要
本发明涉及人工智能、金融科技和医疗科技技术领域,提供了一种基于人工智能的文档处理方法、装置、设备及介质,该方法将文档图片输入多模态大模型,进行元素级分割和分类,得到各类元素的边界框和类别标签;按照各类元素的边界框,从文档图片中截取各类元素的独立子图;将各类元素的独立子图,输入元素的类别标签对应的处理模型,以提取独立子图中的信息;将提取出的信息进行结构化整合,得到文档图片的信息。利用大模型对文档图片进行元素级分割与分类,然后利用各类型元素涉及的处理模型,对各类元素的独立子图进行针对性信息提取,从而提升复杂文档的信息提取精度,在对多个独立子图的信息进行整合后,得到完整准确的文档信息。
技术关键词
元素 图片 多模态 标签 文本识别模型 输入数学公式 医疗科技技术 表格 长短期记忆网络 光学字符识别 符号 版面结构 印章 文本编码器 可读存储介质 处理器 注意力机制 图像增强 模块
系统为您推荐了相关专利信息
智能管理终端 电磁锁驱动 灯光控制器 危化品智能 智能实验室
文档生成装置 案例库 语义 模块 参数
隧道超前地质预报 地质灾害风险评估 风险预警方法 不良地质体 三维模型
数字孪生模型 累计偏差 决策方法 矩阵 工控机
协方差矩阵 噪声误差 加权最小二乘 校正方法 传感器阵列