摘要
本发明涉及自然语言处理领域,提供一种基于混合损失的问答处理方法、装置、电子设备及介质,其中的方法包括:获取待答复问题;基于预先训练的问答模型,根据待答复问题,获取待答复问题对应的回答结果;问答模型基于问题样本和带标签的答案样本通过划分多个训练阶段进行训练优化得到,多个训练阶段所使用的目标损失函数不同,且至少一个训练阶段所使用的目标损失函数包括全序列损失函数和答案损失函数。该方法通过在问答模型的监督微调过程中同时引入全序列损失函数和答案损失函数,不仅能让模型更好地学习输出文本的整体格式与内容一致性,还能加强模型对答案准确率的关注,最终实现了答案输出格式的规范性和稳定性,还实现了答案准确率的提高。