基于非结构化文本及结构化信息构建AI知识库的方法和系统
申请号:CN202411646773
申请日期:2024-11-18
公开号:CN119597934A
公开日期:2025-03-11
类型:发明专利
摘要
一种基于非结构化文本及结构化信息构建AI知识库的方法和系统。该方法包括从非结构化文本数据源和结构化数据源中获取原始数据;对非结构化文本信息和结构化信息进行预处理,通过命名实体识别提取非结构化文本和结构化信息的实体数据集合;将非结构化文本的实体数据和结构化信息的实体数据转换为向量表示,对向量表示进行数据分析,计算非结构化文本和结构化信息的向量表示的相似度和关联指数,确定实体数据之间的关联性;将具有关联性的实体数据进行联合;构建知识图谱。本发明的方案实现了非结构化文本及结构化信息的智能融合。
技术关键词
非结构化文本信息
构建知识图谱
命名实体识别
关系网络
指数
知识图谱构建
关系型数据库
归一化方法
数据分析模块
爬虫技术
噪声数据
数据接口
数据格式
处理器
可读存储介质