一种基于大模型的文档识别与校核方法及装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于大模型的文档识别与校核方法及装置
申请号:CN202511503346
申请日期:2025-10-21
公开号:CN120975100A
公开日期:2025-11-18
类型:发明专利
摘要
本发明提供了一种基于大模型的文档识别与校核方法及装置,方法包括获取待识别的文档,将所述文档转换成图片格式,将得到的文档图片输入到预训练的视觉大模型中,输出识别到的信息;将所述视觉大模型识别到的信息输入到语言大模型中,通过提示词工程撰写需要提取的字段信息,引导语言大模型对输入信息进行关键词提取,将所需提取的字段信息以结构化的方式输出;配置校核规则,包括构建校核脚本以及校核规则知识库;将输出的数据输入到校核大模型中,校核大模型结合RAG检索增强生成技术构建动态双引擎检索机制,对输入的信息进行校核;生成校核结果,并进行可视化展示。本发明能够提高各类文档识别的准确率和鲁棒性。
技术关键词
校核方法 规则知识库 文档图像数据 生成技术 模糊文档图像 计算机可读取存储介质 融合业务系统 视觉 关键词 数据获取装置 自定义脚本 强化学习算法 段落结构 图片 处理器 注意力机制 核装置