基于梯度下降方法比对学习的语料知识库自学习方法及装置
申请号:CN202510081954
申请日期:2025-01-20
公开号:CN119540958B
公开日期:2025-04-25
类型:发明专利
摘要
本申请实施例提供一种基于梯度下降方法比对学习的语料知识库自学习方法及装置,涉及档案数字化技术领域,所述方法包括:获取扫描的档案图像数据以及对应的著录语音数据;对所述档案图像数据进行字体识别并转换成第一文本信息,并增加至著录项字段中,得到著录项字段;对著录语音进行语音识别并转换成第二文本信息,形成人工目录;对著录项字段进行智能识别,得到机器目录;对人工目录与机器目录进行比对分析,形成学习结果;对学习结果进行语义检索分析;利用大数据处理和智能学习等手段,将人工智能技术应用于档案数字化操作流程,有效提高档案数字化方法效率和产出质量,加快档案数字化的发展进程。
技术关键词
学习方法
目录
语音
文本
语义理解技术
语义分析模型
字体
光学字符识别
图像
档案数字化技术
深度学习算法
数字信号处理算法
直方图均衡化方法
数据
句法分析技术
自然语言
麦克风阵列采集
语义角色标注
卷积神经网络模型