摘要
本发明公开了一种基于深度学习的自动化数据标注方法及系统,涉及数据标注技术领域,包括从多源数据源中收集文本数据进行预处理并提取数据词向量,对小规模的文本数据进行初步手动标注并构建动态提示模板;基于动态提示模板构建深度学习模型进行自动化数据标注并评估标注数据的质量;将标注后的数据存储在数据库中并实施访问控制。本发明通过预处理多源数据并构建词汇共现矩阵和混合词向量模型深入提取多源数据的词向量进行融合,根据手动标注的样本构建动态提示模板并基于动态模板数据构建深度学习模型进行自动化数据标注,提供了高质量的词向量进行模型的训练有助于模型更准确的执行标注任务,提高了数据标注的自动化水平和标注数据的质量。