一种基于SDT-MCM的重叠实体关系抽取方法、装置、设备及介质
申请号:CN202410770535
申请日期:2024-06-14
公开号:CN118504571B
公开日期:2025-03-07
类型:发明专利
摘要
本发明涉及一种基于SDT‑MCM的重叠实体关系抽取方法、装置、设备及介质,属于关系分类技术领域,用于基于训练完备的SDT‑MCM模型对待预测文本进行联合抽取,获得预测结果;SDT‑MCM模型包括语义特征提取模块、句法特征提取模块、多维角标注模块、分类器模块;基于SDT‑MCM的重叠实体关系抽取方法包括:基于语义特征提取模块提取出文本的语义特征;基于文本数据对应的句法依赖树构建字邻接图,基于句法特征提取模块对字邻接图进行特征提取,获得句法特征;基于语义特征以及句法特征获得融合特征,基于多维角标注模块对融合特征进行标注,获得多维角标注矩阵;基于分类器模块对多维角标注矩阵进行实体和关系的联合抽取,实现文本的重叠实体与关系的抽取。
技术关键词
实体关系抽取方法
语义特征提取
融合特征
三元组
文本
特征提取模块
分类器
预定义关系
BERT模型
矩阵
标注策略
计算机可读程序
非线性
挖掘头
依存句法分析