摘要
本发明属于数据挖掘技术领域,尤其涉及一种基于用户行为分析的社交媒体数据挖掘方法。实时采集用户多源行为数据,通过自然语言处理解析非结构化数据,提取关键词组并映射至结构化字段;经数据清洗剔除异常数据后,在时间窗口内构建行为序列,引入时间感知嵌入向量生成时序特征表示,同时利用BERT提取行为内容语义向量,融合行为类型、强度等特征生成统一内容表示向量;最后通过BiGRU‑Attention网络融合两类特征,预测用户未来行为概率值以驱动个性化推荐。该方法解决现有技术对行为语义动因捕捉不足、数据异构性处理困难及动态建模能力弱等问题,提升了社交媒体数据挖掘精度。