摘要
本发明提供了一种基于知识图谱和大模型的智能表格问答方法及系统,包括:通过OCR模型和VL模型的组合方式识别表格;决定是否需要VL模型优化转化结果;以属性图的形式存储于图数据库中;将表格的结构信息单独抽取并存储,同时将数据冗余存储在向量数据库中;将用户的自然语言问题转化为图数据库查询语句,并执行查询语句进行数据召回;调用大模型生成最终的问题答案。本发明通过OCR模型和视觉语言模型的组合识别策略,配合基于CLIP模型的质量判断机制,能够准确识别包含多级表头、合并单元格等复杂结构的表格,有效解决了传统方法在复杂表格识别上的准确率低、数据丢失等问题。