知识迁移与消息空间采样的多语言社交媒体事件检测方法

申请号：CN202510878696

申请日期：2025-06-27

公开号：CN120873184A

公开日期：2025-10-31

类型：发明专利

摘要

本发明涉及知识迁移与消息空间采样的多语言社交媒体事件检测方法，属自然语言处理领域。本发明包括：利用预训练语言模型词嵌入方法对打乱的中文、英文、越南语社交媒体消息进行编码，利用随机游走完善粗略的多语言社交媒体消息图中缺失的关系连接，得到异构多语言社交媒体消息图，再将异构多语言社交媒体消息图转换为同构多语言社交媒体消息图；利用基于角度约束的成对损失采样策略对同构多语言社交媒体消息图进行GNN图神经网络训练并采用改进的成对损失进行正负样本采样，进行聚类训练，得到聚类结果。本发明通过将多语言信息作为指导信息融入实现多语言社交媒体消息聚类，从获取到的多语言社交消息网络数据中得到聚类信息。

技术关键词

事件检测方法消息社交媒体多语言样本节点预训练语言模型维基百科邻居词嵌入方法粗略神经网络训练矩阵聚类语义非暂态计算机可读存储介质事件检测系统异构编码器