一种KMeans-LSTM模型和评论文本特征提取与虚假评论识别方法
申请号:CN202410798646
申请日期:2024-06-20
公开号:CN118656671A
公开日期:2024-09-17
类型:发明专利
摘要
本发明公开了一种KMeans‑LSTM模型和评论文本特征提取与虚假评论识别方法,属于评价系统领域,所述KMeans‑LSTM模型包括:TF‑IDF评论文本向量化、基于K‑means聚类算法的数据集平衡、GloVe预训练词嵌入以及LSTM分类器。评论文本特征提取与虚假评论识别方法包括:S1,数据预处理、S2,聚类与数据平衡、S3,词嵌入与模型训练、S4,模型评估与应用。本发明有效解决了数据不平衡的问题同时利用深度学习技术提高了模型的学习能力和预测准确性。该模型提高了虚假评论的识别率也具有较强的泛化能力,并且能够适用于不同来源和类型的评论数据。通过分析和应用来自不同源的评论数据,增强了模型的泛化能力。这样的方法使得模型不仅适用于训练时的数据集,也能有效处理其他来源的数据。
技术关键词
评论识别方法
LSTM模型
文本
数据
算法
深度学习技术
分类器
关键词
聚类
评价系统
训练集
有效性
语义
标签
样本
网络