摘要
本发明公开了一种基于语义理解的专利检索方法,涉及专利文件检索技术领域,解决了现有技术的专利检索方法难以捕捉查询意图背后的深层语义关联,导致用户在专利检索过程中的准确性和效率不高的技术问题;本发明通过文档解析器和图形信息检测模型能够从原始文本中准确提取文字内容和图像中的结构信息;采用排序树算法对这些结构信息进行优化排序,确保了格式化专利文本的高质量整合。基于历史查询记录的大模型分析提取出关键信息,结合语义模型生成对应的嵌入向量,并将嵌入向量和对应的格式化文本存储于向量数据库。当用户提交查询时通过语义模型生成查询向量,并在向量数据库中快速检索匹配的结果集,从而提高了检索效率和准确性。