摘要
本申请提出了一种联邦公文检错模型、公文检错方法及系统。属于文本检错技术领域,该模型包括中文预训练的词向量模型BERT Embedding、Encoder结构、Decoder结构和转移矩阵CRF层。公文检错方法包括将转化后的向量通过Encoder结构对本地数据集进行初步训练和参数更新得到Encoder向量,并将得到Encoder向量传入共有结构/私有结构;通过共有结构/私有结构中的Decoder结构对输入的Encoder向量进行再训练得到训练好的Encoder向量;将训练好的Encoder向量通过转移矩阵CRF层对输出概率做调整,得到输出结果,并根据输出结果更新模型参数,多轮迭代,直至完成训练得到训练好的公文检错模型;对输入的公文进行纠错并显示纠错内容。通过这样的设置够提升公文检错的准确率。