摘要
本发明公开了一种基于多模态的智能标注方法和系统,涉及数据标注技术领域,包括:从多个来源收集多模态数据,对收集的数据进行预处理,根据任务需求对多模态数据进行标注,将标注好的数据集划分为训练集、验证集和测试集;选择模型架构,设置训练参数,使用训练集数据对模型进行训练,优化模型参数;通过验证集定期评估模型性能,调整训练策略;在测试集上评估模型的性能,根据测试结果对模型进行改进。本发明通过将多模态大模型微调应用于标注,代替现有的人工标注方式,大大节约了企业用工成本,本发明的智能标注既可以用于数据准备前的粗筛,还可以对小模型结果的二次校验,提升了模型的泛化能力,带来更好的标注效果。