基于大语言模型的企业问答方法、系统、设备及存储介质
申请号:CN202510720464
申请日期:2025-05-29
公开号:CN120508627A
公开日期:2025-08-19
类型:发明专利
摘要
本发明提出一种基于大语言模型的企业问答方法,收集企业内部供检索的非结构化文本数据和结构化文本数据;利用预训练的文本向量化模型将文本段块转换为向量存储到向量数据库;在开源大模型的基础上利用LORA微调方法对训练数据进行训练得到问题改写模型;基于SQL生成模型对用户新输入的问题进行预测得到SQL语句,再经过人工校验并重新训练SQL生成模型;利用问题改写模型进行改写得到上下文完整的问题,利用意图识别模型识别问题后得到具体意图,利用实体信息抽取模型获取问题中的实体信息并通过关键词匹配获取宽表的字段,将组合完成的SQL语句查询出具体的数据返回;将RAG召回的文本段块与调用的数据输入开源大模型作为最终结果输出。
技术关键词
意图识别模型
信息抽取模型
大语言模型
问答方法
数据
实体
微调方法
企业
非暂态计算机可读存储介质
语句
非结构化文本
矩阵
关键词
处理器
问答系统
计算机程序产品
元素