摘要
本发明公开了一种基于大数据的电影评分系统及方法,包括数据采集层、数据存储与处理层、模型构建层、服务层以及用户界面层:数据采集层:进行数据采集;数据存储与处理层:对采集到的数据进行数据清洗与预处理,从预处理后数据中提取特征;模型构建层:负责处理和分析大数据,生成电影评分,使用朴素贝叶斯分析用户行为数据,量化正面/负面情感,当特定群体的情感倾向分布不平衡时,使用焦点损失来降低易分类样本的权重,基于电影特征、多维度特征以及时间特征,采用多任务学习训练多个XGBoost模型,分别预测不同维度的评分,朴素贝叶斯分析结果为不同维度提供情感倾向的输入,同时,结合群体特征,为不同群体提供个性化的评分。