一种融合语义特征和关键词的核电知识库检索方法及系统
申请号:CN202410802857
申请日期:2024-06-20
公开号:CN118626591A
公开日期:2024-09-10
类型:发明专利
摘要
本发明涉及信息检索技术领域,提供了一种融合语义特征和关键词的核电知识库检索方法及系统。该方法包括,获取与核电相关的输入文档,并将其分割成多个长度小于第一设定值的文本片段;基于文本片段,采用神经网络,提取文本特征,基于文本特征,采用前馈神经网络,得到隐藏状态;提取隐藏状态中指定位置的状态向量作为文本片段语义特征的稠密向量;基于隐藏状态中所有位置的状态向量,计算文本关键词的稀疏权重向量;建立文本片段与稠密向量和稀疏权重向量之间的分层索引,以此构建核电知识库;基于用户输入内容,重装组成若干个查询语句,计算所有查询语句的稠密向量和稀疏权重向量,并根据相似度计算,找到核电知识库中对应的检索结果。
技术关键词
知识库检索方法
融合语义
关键词
文本
前馈神经网络
语义特征
大语言模型
列表
知识库检索系统
语句
信息检索技术
表格
标志
索引
标识符
处理器
分层
意图
计算机设备
字符