一种基于深度学习的自动化数据标注方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于深度学习的自动化数据标注方法及系统
申请号:CN202410872145
申请日期:2024-07-01
公开号:CN118862879B
公开日期:2025-03-14
类型:发明专利
摘要
本发明公开了一种基于深度学习的自动化数据标注方法及系统,涉及数据标注技术领域,包括从多源数据源中收集文本数据进行预处理并提取数据词向量,对小规模的文本数据进行初步手动标注并构建动态提示模板;基于动态提示模板构建深度学习模型进行自动化数据标注并评估标注数据的质量;将标注后的数据存储在数据库中并实施访问控制。本发明通过预处理多源数据并构建词汇共现矩阵和混合词向量模型深入提取多源数据的词向量进行融合,根据手动标注的样本构建动态提示模板并基于动态模板数据构建深度学习模型进行自动化数据标注,提供了高质量的词向量进行模型的训练有助于模型更准确的执行标注任务,提高了数据标注的自动化水平和标注数据的质量。
技术关键词
数据标注方法 词向量模型 文本 深度学习模型 节点特征 模板 动态 轮廓系数 小规模 数据标注技术 数据标注系统 数据存储 词向量构建 聚类算法 深度学习训练 访问控制策略 邻居 BERT模型