基于强化反馈的医疗交互式大模型训练方法与系统

申请号：CN202510964052

申请日期：2025-07-14

公开号：CN120809166A

公开日期：2025-10-17

类型：发明专利

摘要

本发明涉及一种基于强化反馈的医疗交互式大模型训练方法，涉及医疗交互领域，所述方法包括：基于输入数据序列和输出数据序列建立医疗交互式大模型；在完成一次医疗交互后，根据针对对话答复框最新答复内容反馈的评分数值确定对医疗交互式大模型的补充训练次数以完成对大模型的强化训练。本发明还涉及一种基于强化反馈的医疗交互式大模型训练系统。通过本发明，针对医疗交互式大模型无法量化式地强化反馈训练且内部结构不够完善的技术问题，通过引入隐藏层数量动态选择的深度神经网络架构以及定制化数据结构，完善医疗交互式大模型的结构，同时根据针对最新答复内容反馈的评分数值确定对大模型的补充训练次数，从而解决了上述技术问题。

技术关键词

医疗交互深度神经网络架构关键词字符模型训练系统数值模型训练方法序列数据关系存储器件显示器件生理手术参数疾病药物患者动态

系统为您推荐了相关专利信息

一种基于双向预训练的软件漏洞自动修复方法

漏洞自动修复方法前馈神经网络软件注意力机制数据

一种融合语义特征和关键词的核电知识库检索方法及系统

知识库检索方法融合语义关键词文本前馈神经网络

文本匹配模型的训练方法、文本匹配方法及设备

特征提取网络音频样本文本匹配方法语法特征

一种基于人机交互的多系统能力智能执行方法及系统

人机交互输入机器学习训练模型节点意图识别定义

一种基于特征蒸馏的概念相似度计算方法和系统

度计算方法定义分词术语概念