基于文本内容和学术网络的学者研究兴趣挖掘方法及系统
申请号:CN202411442211
申请日期:2024-10-16
公开号:CN118964607B
公开日期:2025-03-07
类型:发明专利
摘要
本发明公开了基于文本内容和学术网络的学者研究兴趣挖掘方法及系统,方法包括:基于论文数据,采用预训练语言模型生成节点嵌入,节点嵌入包括技术词节点嵌入、论文节点嵌入、学者节点嵌入以及领域节点嵌入;基于学术数据构建学术异构图,并使用节点嵌入构建动态学术网络,在动态学术网络上建模学者和领域特征,生成具有时间特性的学者节点向量以及领域节点向量;将学者节点向量以及领域节点向量做向量内积,得到学者和领域之间的得分,并基于得分确定用于反映学者研究兴趣的预测结果。本发明充分考虑了学术网络丰富的异构信息,且考虑了学者、领域、技术词等实体在时间维度上的动态性,提高了学者兴趣预测结果的准确性。
技术关键词
兴趣挖掘方法
节点
预训练语言模型
论文
网络
文本
word2vec模型
异构
动态
时序特征
关系
命名实体识别
计算机设备
可读存储介质
挖掘系统
特征提取模块
生成技术
数据
处理器