基于强化反馈的医疗交互式大模型训练方法与系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于强化反馈的医疗交互式大模型训练方法与系统
申请号:CN202510964052
申请日期:2025-07-14
公开号:CN120809166A
公开日期:2025-10-17
类型:发明专利
摘要
本发明涉及一种基于强化反馈的医疗交互式大模型训练方法,涉及医疗交互领域,所述方法包括:基于输入数据序列和输出数据序列建立医疗交互式大模型;在完成一次医疗交互后,根据针对对话答复框最新答复内容反馈的评分数值确定对医疗交互式大模型的补充训练次数以完成对大模型的强化训练。本发明还涉及一种基于强化反馈的医疗交互式大模型训练系统。通过本发明,针对医疗交互式大模型无法量化式地强化反馈训练且内部结构不够完善的技术问题,通过引入隐藏层数量动态选择的深度神经网络架构以及定制化数据结构,完善医疗交互式大模型的结构,同时根据针对最新答复内容反馈的评分数值确定对大模型的补充训练次数,从而解决了上述技术问题。
技术关键词
医疗交互 深度神经网络架构 关键词 字符 模型训练系统 数值 模型训练方法 序列 数据 关系 存储器件 显示器件 生理 手术 参数 疾病 药物 患者 动态
系统为您推荐了相关专利信息
漏洞自动修复方法 前馈神经网络 软件 注意力机制 数据
知识库检索方法 融合语义 关键词 文本 前馈神经网络
特征提取网络 音频 样本 文本匹配方法 语法特征
人机交互输入 机器学习训练模型 节点 意图识别 定义
度计算方法 定义 分词 术语 概念