模型训练方法及相关装置、图像处理方法及相关装置

申请号：CN202411981134

申请日期：2024-12-30

公开号：CN119918670A

公开日期：2025-05-02

类型：发明专利

摘要

本申请的实施例揭示了模型训练方法及相关装置、图像处理方法及相关装置。该模型训练方法包括：基于训练图像对应的上下文信息、问题以及问题答案选项，生成第一训练文本，并将所述第一训练文本和所述训练图像输入至多模态模型中，以获得所述多模态模型输出的中间推理逻辑；基于所述中间推理逻辑、所述训练问题和所述问题答案选项，生成第二训练文本，并将所述第二训练文本输入至语言模型中，以获得所述语言模型输出的预测答案；根据所述中间推理逻辑、所述预测答案和所述问题对应的真实答案确定训练损失值；基于所述训练损失值对所述多模态模型和所述语言模型进行参数优化。本申请的实施例能够提高大模型的推理准确性。

技术关键词

答案文本多模态模型训练方法逻辑图像处理方法计算机可读指令模型训练装置图像处理装置模块电子设备参数处理器存储装置可读存储介质程序

系统为您推荐了相关专利信息

加解密加速方法、装置、计算机设备和存储介质

虚拟设备硬件设备容器节点集群

基于检索增强生成的知识库存储检索系统和方法

存储检索系统关键字表格列表图片

一种面向视觉文本交互的多模态数据融合方法及系统

数据融合方法文本视觉特征运动特征节点

面向特殊事件的道路客运线路客流预测方法及系统

客流预测系统客流预测方法站点深度强化学习节假日信息

一种变压器健康评估与技改决策优化方法

决策优化方法油色谱数据生成对抗网络多模态深度学习振动频谱分析