摘要
本发明公开一种增强可解释性的解耦表征微博话题检测方法,包括以下步骤:(1)构建用户级对话网络;(2)搭建多粒度注意力框架,其中,通过单词级注意力缓解口语化带来的噪声影响,再通过用户级注意力建模不同用户对话题的影响力,得到层次化文本表示,并与存储结构信息的邻接矩阵融合,生成用户节点表示;(3)将用户节点表示作为神经变分推理的输入,以变分自编码器为推理框架,利用推理网络对节点信息进行编码,生成更具连贯性的话题向量;(4)使用解耦表征模块从话题向量中提取影响话题的潜在生成因子,利用生成网络重构解耦生成因子的节点嵌入,得到话题词分布,并对话题词分布添加稀疏约束,以使其更符合真实社交媒体数据特征。