摘要
本申请的实施例揭示了模型训练方法及相关装置、图像处理方法及相关装置。该模型训练方法包括:基于训练图像对应的上下文信息、问题以及问题答案选项,生成第一训练文本,并将所述第一训练文本和所述训练图像输入至多模态模型中,以获得所述多模态模型输出的中间推理逻辑;基于所述中间推理逻辑、所述训练问题和所述问题答案选项,生成第二训练文本,并将所述第二训练文本输入至语言模型中,以获得所述语言模型输出的预测答案;根据所述中间推理逻辑、所述预测答案和所述问题对应的真实答案确定训练损失值;基于所述训练损失值对所述多模态模型和所述语言模型进行参数优化。本申请的实施例能够提高大模型的推理准确性。