摘要
本发明涉及人工智能领域,公开了一种基于大数据的文案语义识别系统及方法,该系统包括:数据采集模块从多种数据源收集文案数据,以设定时间间隔自动采集新数据,并对采集到的数据进行预处理,包括初步清洗,以去除重复数据及格式错误数据;所述数据源包括网页、社交媒体平台及文档数据库;大数据存储模块存储经初步清洗后的文案数据;语义识别模型训练模块利用存储于所述大数据存储模块中的数据训练语义识别模型;语义识别执行模块,与所述语义识别模型训练模块及大数据存储模块连接,使用训练好的语义识别模型对新输入的文案进行语义识别,输出识别结果,所述识别结果至少包括文案的主题分类、情感倾向判断、关键语义信息提取。