一种基于知识图谱和大模型的智能表格问答方法及系统

申请号：CN202511460968

申请日期：2025-10-14

公开号：CN120950659A

公开日期：2025-11-14

类型：发明专利

摘要

本发明提供了一种基于知识图谱和大模型的智能表格问答方法及系统，包括：通过OCR模型和VL模型的组合方式识别表格；决定是否需要VL模型优化转化结果；以属性图的形式存储于图数据库中；将表格的结构信息单独抽取并存储，同时将数据冗余存储在向量数据库中；将用户的自然语言问题转化为图数据库查询语句，并执行查询语句进行数据召回；调用大模型生成最终的问题答案。本发明通过OCR模型和视觉语言模型的组合识别策略，配合基于CLIP模型的质量判断机制，能够准确识别包含多级表头、合并单元格等复杂结构的表格，有效解决了传统方法在复杂表格识别上的准确率低、数据丢失等问题。

技术关键词

表格问答方法数据库查询语句关系型数据库数据冗余语义向量子模块节点表头答案合并单元格构建知识图谱知识图谱构建自然语言特征提取模型实体