摘要
本发明涉及一种虚假评论检测方法,属于互联网信息安全技术领域,主要解决现有技术中数据采集不完整、特征建模单一、模型更新迟缓及阈值判定僵化的问题。该方法通过分布式爬虫系统实时采集评论文本数据,经预处理模块过滤非语言字符并规范文本长度,提取包含语义、用户行为及时空关联的三维特征集合;采用双层动态分类模型进行训练;基于滑动时间窗口划分训练集与验证集,当新数据与历史特征余弦相似度低于0.7时启动增量学习并调整全连接层参数,通过动态阈值模块实时计算中位数与上四分位数的加权值判定异常评论,生成带哈希校验码的结构化检测报告。该方法适用于在线平台虚假评论的实时监测与风险管控,提升检测效率与准确性。